目录文档-技术白皮书18-EFT.WP.Methods.CrossStats v1.0

第6章 多重比较与错误控制(FWER/FDR/Sequential)


一句话目标:以统一 alpha_budget 与可审计阈值实现 FWER/FDR/序贯错误控制,覆盖离线与在线、分层与加权、依赖与非依赖场景,并将决策口径落盘到 manifest.stats.multiplicity.*。


I. 范围与对象

  1. 范围
    适用于同一研究或运行窗口内的多指标、多切片、多时段假设集合 H = { H_i } 的错误控制。涵盖离线批次、在线流式与序贯监测。
  2. 对象
    • 输入:p_i 或检验统计量 Z_i,目标家族错误率 FWER 或 FDR 控制水平 alpha 或 q,家族大小 m,权重 w_i,依赖假设类型 dep ∈ {indep, PRDS, arbitrary},序贯查看点 t = 1..T 与 alpha_spending。
    • 输出:拒绝集 R,调整后 p_i_adj 或阈值 tau_i,序贯边界与停序决策,错误控制评估与契约报告。
    • 约束:所有统计窗口在 tau_mono 上计算,以 ts 发布;若指标涉及到达时度量 T_arr,并行记录两口径与 delta_form。

II. 名词与变量


III. 公设 P306-*


IV. 最小方程 S306-*

  1. S306-1(Bonferroni FWER 控制)
    • 阈值:p_i ≤ alpha / m。
    • 调整 p 值:p_i_adj = min( 1, m * p_i )。
  2. S306-2(Šidák FWER 控制,独立)
    阈值:p_i ≤ 1 - ( 1 - alpha )^( 1 / m )。
  3. S306-3(Holm 步降 FWER)
    • 排序 p_(1) ≤ ... ≤ p_(m),找最小 k 使得 p_(k) > alpha / ( m - k + 1 );拒绝所有 i < k。
    • 调整 p 值:p_(i)_adj = max_{j ≤ i} ( ( m - j + 1 ) * p_(j) ) 截至 1。
  4. S306-4(Hochberg 步升 FWER,独立或同方向依赖)
    找最大 k 使 p_(k) ≤ alpha / ( m - k + 1 );拒绝所有 i ≤ k。
  5. S306-5(BH FDR 控制)
    • 排序后取 k = max{ i : p_(i) ≤ ( i / m ) * q };拒绝所有 i ≤ k。
    • 加权 BH:以权重 w_i(bar{w} = 1)替换为 p_i / w_i ≤ ( i / m ) * q。
  6. S306-6(BY FDR 控制,任意依赖)
    使用 c_m = ( ∑_{j=1}^m 1 / j ),阈值 p_(i) ≤ ( i / ( m * c_m ) ) * q。
  7. S306-7(门控与层级)
    家族序 F_1 → F_2 → ...,若 F_k 通过门槛,则将未用 alpha 转移至 F_{k+1};保持 ( ∑ alpha_k ) ≤ alpha_budget。
  8. S306-8(组序贯花费 Alpha Spending)
    • 花费函数 A(t) 非减,A(1)=alpha_budget;第 t 次查看消耗 alpha_t = A(info_t) - A(info_{t-1})。
    • 典型形式:A_Pocock(t) = alpha * log(1 + (e - 1) * t),A_OBF(t) = 2 - 2 * Phi( z_alpha / sqrt(t) )(双侧示例,需与边界解耦求 z_t)。
    • 边界以 alpha_t 求得:P( |Z_t| ≥ z_t | H0 ) = alpha_t。
  9. S306-9(序贯 GLRT / SPRT)
    似然比 LR_t = ( ∏_{s=1}^t f_1(X_s) ) / ( ∏_{s=1}^t f_0(X_s) ),若 LR_t ≥ A 接受 H1,若 LR_t ≤ B 接受 H0;阈值近似 A ≈ (1 - beta) / alpha, B ≈ beta / (1 - alpha)。
  10. S306-10(在线 FDR 投资)
    预算 W_0,序列阈值 alpha_t = g( W_{t-1}, policy );若第 t 次拒绝则 W_t = W_{t-1} - cost(alpha_t) + reward(p_t, policy),否则 W_t = W_{t-1} - cost(alpha_t);保证 FDR ≤ q 的 policy 需固定并记录。
  11. S306-11(到达时两口径差)
    delta_form = | ( 1 / c_ref ) * ( ∫ n_eff d ell ) - ( ∫ ( n_eff / c_ref ) d ell ) |,并断言 delta_form ≤ tol_Tarr(当检验量依赖 T_arr)。

V. 统计流程 M30-6(就绪→建族→选择法→执行→评估→发布)


VI. 契约与断言(C30-6xx)


VII. 实现绑定 I30-*

不变量:alpha_spent ≤ alpha_budget;bar{w} ≈ 1(加权法);method_dep_compat 恒为真;序贯 stop_time ≤ max_looks。


VIII. 交叉引用


IX. 质量与风控

  1. SLI/SLO
    alpha_overrun = max( 0, alpha_spent - alpha_budget ),fdr_est_gap = max( 0, FDP_hat - q ),boundary_error, latency_ms_p99,R_count,power_proxy(基于最小可检效应)。
  2. 风控与回退
    • 依赖不明时回退至 Holm 或 BY;序贯边界不稳定时使用更保守 pocock;在线异常停止则冻结新假设并切回离线批次。
    • 任何 C30-601/602/606/607 失败触发回滚到上一个已签名的 manifest.stats.multiplicity。

小结

本章以 P306-* 统一错误预算与依赖口径,给出 S306-* 的 FWER/FDR/序贯控制公式与门控、加权、在线扩展,落地 M30-6 的标准流程,并通过 I30-6* 形成可复现、可审计的多重比较治理闭环。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/