49-误差预算卡 Template v1.0 | 第7章样本量、功效与稳健选项

目录／文档-技术白皮书（V5.05）／ 49-误差预算卡 Template v1.0

第7章样本量、功效与稳健选项

I. 目的与范围（Purpose & Scope）

与分层设计指引，使不确定度评估与质量门阈值（Chapter 8）对齐。稳健选项情形下的样本量（N）与统计功效（1−β）的计算与配置口径，覆盖均值差、相关系数、比例/通过率等常见指标；提供重尾/异方差/相关给出

II. 前置条件与输入（Prerequisites & Inputs）

控制式与路径显式：涉及 T_arr/Phi 时，正文同时给出 gamma(ell) 与 d ell，数据/元数据记录 delta_form ∈ {general, factored}。
功效目标与检验口径：预注册 α、目标功效 1−β、备择效应大小（d、r_target 等）、多重控制（FDR）。
协方差与相关结构：按第5章给出核与参数（Σ）；必要时分层/分段。
质量门映射：确认与 τ_T、r_phi_min、ε_flux guard、Q_res band 的对齐关系。

III. 连续型终点：均值差（Difference in Means）

双侧、独立样本、近似同方差：
N_per_group ≈ 2 · ( z_{1−α/2} + z_{1−β} )^2 / d^2，其中 d = |μ_1 − μ_0| / σ_pooled。
配对设计（如同一 record_id 前后对比）：
将 σ_pooled 替换为配对差的标准差 σ_Δ；效应量 d = |Δ̄| / σ_Δ。
异方差修正：使用 Welch 近似自由度；或以稳健方差（Huber/HC 型）替代 σ_pooled。

IV. 相关性终点：r（Phase Consistency 等）

Fisher–z 近似：z = atanh(r)；
N ≈ ( z_{1−α/2} + z_{1−β} )^2 / ( atanh(r_target) )^2 + 3。
区间与判定：先在参考窗对齐相位，再基于 Fisher–z 报告区间并反变换回 r。

V. 通过率/比例类指标（合格率、门限通过）

两比例比较：
N_per_group ≈ ( z_{1−α/2}√(2 p̄(1−p̄)) + z_{1−β}√( p_1(1−p_1)+p_0(1−p_0) ) )^2 / (p_1−p_0)^2，p̄=(p_1+p_0)/2。
单比例对阈值：Clopper–Pearson 或 Wilson 区间反解所需样本量；重尾可转用贝叶斯 Beta–Binomial 先验。

VI. 相关结构与设计效能修正（Design Effects）

聚类/通道相关（设计效应）：N_eff = N / DEFF，DEFF ≈ 1 + (m−1)ρ（每簇样本量 m，类内相关 ρ）。
路径相关（沿 ℓ）：按第5章核给出有效自由度 ν_eff ≈ L_total / (2 L_c)；将 N 替换为 ν_eff 参与功效计算。
分层与配对：按 {batch/device/region} 分层随机化；配对或成组块内比较以降低方差。

VII. 稳健选项（Heavy-Tail / Heteroskedasticity / Outliers）

稳健效应量：以中位数差与**分位差（IQR/中位数绝对偏差 MAD）**定义 d_robust，在公式中以 d ← d_robust 近似。
损失与估计：Huber/分位回归；报告等价二阶代理（用于 Δ 法传播）。
功效保守放大系数：当证据指向重尾/非正态，样本量放大 ×(1.15–1.35)；或提升 B（自举/MC）稳健评估。

VIII. 自举/置换的功效评估（Non-Parametric Power）

自举功效：模拟 B ≥ 10^4 次；每次在训练/验证分层内重抽样，计算阳性率估计 π̂_power，使其 ≥ 目标功效。
置换功效：对原假设标签置换，计算统计量分布与阈值，估计检验功效；相位类在参考窗内先对齐再置换。

IX. 顺序与自适应方案（Sequential / Adaptive）

顺序检验：采用 O’Brien–Fleming / Pocock 界；在中期分析时调整 α 消耗并更新剩余样本量。
自适应扩样：以中期估计的 σ、ρ、效应量更新 N；遵循预注册的调整规则，保持 I 型错误控制。

X. 与质量门阈值映射（Alignment with Gates）

ΔT_arr 的 U = k·u_c 与 τ_T 对照；r_phi 区间下界 ≥ r_phi_min；ε_flux 分位上界在守恒带内；Q_res 位于许可带（G6）。
任一核心门未满足时，标注 [Restricted]，仅发布定性趋势与诊断图。

XI. 机读模板（Machine-Readable）

A. power_plan.yaml

version: "1.0.0"

targets:

- name: "DeltaT_arr"

type: "means_diff"

alpha: 0.01

power: 0.90

effect_size_d: 0.35

design: { paired: true, deff: 1.00 }

- name: "r_phi"

type: "correlation"

alpha: 0.01

power: 0.90

r_target: 0.60

fisher_z: true

- name: "epsilon_flux"

type: "threshold_rate"

alpha: 0.05

power: 0.80

p0: 0.15

p1: 0.07

robust:

loss: "huber"

inflate_factor: 1.20

stratification: ["batch","device","region"]

correlation:

path: { kernel: "exp", L_c_m: 25.0 }

sequential:

scheme: "obrien_fleming"

looks: 2

see:

- "EFT.WP.Core.Metrology v1.0:check_dim"

- "Data.Benchmarks v1.0:PROTO"

B. sample_size_report.md（最小要素）

# Sample Size & Power Report

- Targets: DeltaT_arr (d=0.35), r_phi (r=0.60), epsilon_flux (p0→p1).

- Assumptions: alpha=0.01/0.05, power=0.90/0.80, DEFF=1.10, L_c=25 m.

- Methods: z-approx / Fisher-z / exact proportion; robust inflate ×1.20.

- Outputs: N per group/stratum, sequential spending, bootstrap power curve.

XII. 与其它章节衔接（Cross-Refs）

。第11章；结果页与评分：见第8章；质量门与停止：见第6章；传播方法：见第5章；协方差与相关结构：见第3章控制式与观测量：见

XIII. 执行勾选清单（Checklist）

预注册 α、1−β、效应量与多重控制方案；与质量门阈值已对齐。
指定相关结构与设计效应，得到 N_eff；分层/配对方案明确。
对重尾/异方差启用稳健选项（损失、代理、×放大系数）；MC/自举 B ≥ 10^4。
顺序/自适应规则与 I 型错误控制已记录；中期更新策略可追溯。
已导出 power_plan.yaml / sample_size_report.md；see[]/references[]/version 合规且一致。

版权与许可：除另有说明外，《能量丝理论》（含文本、图表、插图、符号与公式）的著作权由作者（屠广林）享有。
许可方式（CC BY 4.0）：在注明作者与来源的前提下，允许复制、转载、节选、改编与再分发。
署名格式（建议）：作者：屠广林｜作品：《能量丝理论》｜来源：energyfilament.org｜许可证：CC BY 4.0
验证召集： 作者独立自费、无雇主无资助；下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地，不限国家。欢迎各国媒体与同行抓住窗口组织验证，并与我们联系。
版本信息： 首次发布：2025-11-11 ｜当前版本：v6.0+5.05