目录 / 文档-技术白皮书 / 49-误差预算卡 Template v1.0
I. 目的与范围(Purpose & Scope)
与分层设计指引,使不确定度评估与质量门阈值(Chapter 8)对齐。稳健选项情形下的样本量(N)与统计功效(1−β)的计算与配置口径,覆盖均值差、相关系数、比例/通过率等常见指标;提供重尾/异方差/相关给出II. 前置条件与输入(Prerequisites & Inputs)
- 控制式与路径显式:涉及 T_arr/Phi 时,正文同时给出 gamma(ell) 与 d ell,数据/元数据记录 delta_form ∈ {general, factored}。
- 功效目标与检验口径:预注册 α、目标功效 1−β、备择效应大小(d、r_target 等)、多重控制(FDR)。
- 协方差与相关结构:按第5章给出核与参数(Σ);必要时分层/分段。
- 质量门映射:确认与 τ_T、r_phi_min、ε_flux guard、Q_res band 的对齐关系。
III. 连续型终点:均值差(Difference in Means)
- 双侧、独立样本、近似同方差:
N_per_group ≈ 2 · ( z_{1−α/2} + z_{1−β} )^2 / d^2,其中 d = |μ_1 − μ_0| / σ_pooled。 - 配对设计(如同一 record_id 前后对比):
将 σ_pooled 替换为配对差的标准差 σ_Δ;效应量 d = |Δ̄| / σ_Δ。 - 异方差修正:使用 Welch 近似自由度;或以稳健方差(Huber/HC 型)替代 σ_pooled。
IV. 相关性终点:r(Phase Consistency 等)
- Fisher–z 近似:z = atanh(r);
N ≈ ( z_{1−α/2} + z_{1−β} )^2 / ( atanh(r_target) )^2 + 3。 - 区间与判定:先在参考窗对齐相位,再基于 Fisher–z 报告区间并反变换回 r。
V. 通过率/比例类指标(合格率、门限通过)
- 两比例比较:
N_per_group ≈ ( z_{1−α/2}√(2 p̄(1−p̄)) + z_{1−β}√( p_1(1−p_1)+p_0(1−p_0) ) )^2 / (p_1−p_0)^2,p̄=(p_1+p_0)/2。 - 单比例对阈值:Clopper–Pearson 或 Wilson 区间反解所需样本量;重尾可转用贝叶斯 Beta–Binomial 先验。
VI. 相关结构与设计效能修正(Design Effects)
- 聚类/通道相关(设计效应):N_eff = N / DEFF,DEFF ≈ 1 + (m−1)ρ(每簇样本量 m,类内相关 ρ)。
- 路径相关(沿 ℓ):按第5章核给出有效自由度 ν_eff ≈ L_total / (2 L_c);将 N 替换为 ν_eff 参与功效计算。
- 分层与配对:按 {batch/device/region} 分层随机化;配对或成组块内比较以降低方差。
VII. 稳健选项(Heavy-Tail / Heteroskedasticity / Outliers)
- 稳健效应量:以中位数差与**分位差(IQR/中位数绝对偏差 MAD)**定义 d_robust,在公式中以 d ← d_robust 近似。
- 损失与估计:Huber/分位回归;报告等价二阶代理(用于 Δ 法传播)。
- 功效保守放大系数:当证据指向重尾/非正态,样本量放大 ×(1.15–1.35);或提升 B(自举/MC)稳健评估。
VIII. 自举/置换的功效评估(Non-Parametric Power)
- 自举功效:模拟 B ≥ 10^4 次;每次在训练/验证分层内重抽样,计算阳性率估计 π̂_power,使其 ≥ 目标功效。
- 置换功效:对原假设标签置换,计算统计量分布与阈值,估计检验功效;相位类在参考窗内先对齐再置换。
IX. 顺序与自适应方案(Sequential / Adaptive)
- 顺序检验:采用 O’Brien–Fleming / Pocock 界;在中期分析时调整 α 消耗并更新剩余样本量。
- 自适应扩样:以中期估计的 σ、ρ、效应量更新 N;遵循预注册的调整规则,保持 I 型错误控制。
X. 与质量门阈值映射(Alignment with Gates)
- ΔT_arr 的 U = k·u_c 与 τ_T 对照;r_phi 区间下界 ≥ r_phi_min;ε_flux 分位上界在守恒带内;Q_res 位于许可带(G6)。
- 任一核心门未满足时,标注 [Restricted],仅发布定性趋势与诊断图。
XI. 机读模板(Machine-Readable)
A. power_plan.yaml
version: "1.0.0"
targets:
- name: "DeltaT_arr"
type: "means_diff"
alpha: 0.01
power: 0.90
effect_size_d: 0.35
design: { paired: true, deff: 1.00 }
- name: "r_phi"
type: "correlation"
alpha: 0.01
power: 0.90
r_target: 0.60
fisher_z: true
- name: "epsilon_flux"
type: "threshold_rate"
alpha: 0.05
power: 0.80
p0: 0.15
p1: 0.07
robust:
loss: "huber"
inflate_factor: 1.20
stratification: ["batch","device","region"]
correlation:
path: { kernel: "exp", L_c_m: 25.0 }
sequential:
scheme: "obrien_fleming"
looks: 2
see:
- "EFT.WP.Core.Metrology v1.0:check_dim"
- "Data.Benchmarks v1.0:PROTO"
B. sample_size_report.md(最小要素)
# Sample Size & Power Report
- Targets: DeltaT_arr (d=0.35), r_phi (r=0.60), epsilon_flux (p0→p1).
- Assumptions: alpha=0.01/0.05, power=0.90/0.80, DEFF=1.10, L_c=25 m.
- Methods: z-approx / Fisher-z / exact proportion; robust inflate ×1.20.
- Outputs: N per group/stratum, sequential spending, bootstrap power curve.
XII. 与其它章节衔接(Cross-Refs)
。第11章;结果页与评分:见第8章;质量门与停止:见第6章;传播方法:见第5章;协方差与相关结构:见第3章控制式与观测量:见XIII. 执行勾选清单(Checklist)
- 预注册 α、1−β、效应量与多重控制方案;与质量门阈值已对齐。
- 指定相关结构与设计效应,得到 N_eff;分层/配对方案明确。
- 对重尾/异方差启用稳健选项(损失、代理、×放大系数);MC/自举 B ≥ 10^4。
- 顺序/自适应规则与 I 型错误控制已记录;中期更新策略可追溯。
- 已导出 power_plan.yaml / sample_size_report.md;see[]/references[]/version 合规且一致。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/