目录文档-技术白皮书18-EFT.WP.Methods.CrossStats v1.0

第4章 估计与区间(频率学/贝叶斯一致化)


一句话目标:统一点估计、区间与不确定度的频率学与贝叶斯口径,明确权重、量纲与时基下的发布规则。


I. 范围与对象

  1. 范围
    • 适用于加权样本、复杂抽样与在线流的点估计、区间估计与后验总结。
    • 覆盖均值/比例/率、回归(GLM)、比率与函数型指标 g( theta ) 的不确定度传播。
  2. 对象
    • 输入:数据 D = { (y_i, x_i, w_i, t_i) },抽样信息 pi(i) 或复制权重,窗口 Delta_t,到达时字段 T_arr。
    • 输出:hat{theta}, SE(hat{theta}), CI_{1-alpha} 或后验区间,U = k * u_c,manifest.stats.estim.*。
    • 约束:单位与量纲一致;sum(w_i)/N_hat ≈ 1;时间在 tau_mono 上评估、以 ts 发布。

II. 名词与变量

  1. 基本量
    • theta(参数向量),hat{theta}(估计量),SE(标准误),V(协方差),CI_{1-alpha}(区间)。
    • 加权均值:hat{mu}_w = ( ∑ w_i y_i ) / ( ∑ w_i )。
    • 比率:R = ( ∑ w_i a_i ) / ( ∑ w_i b_i )。
  2. GLM 与稳健方差
    • 评分方程:U( theta ) = ∑ x_i * ( y_i - mu_i( theta ) ) / v_i( theta ) = 0。
    • 三明治方差:V_hat = ( A^{-1} ) * B * ( A^{-1} )^T,其中 A = - ∂U/∂theta, B = ∑ u_i u_i^T。
  3. 贝叶斯要素
    p(theta), L(theta; D), p(theta | D) ∝ L * p(theta),后验预测 p(y_new | D) = ( ∫ p(y_new | theta) p(theta | D) d theta )。
  4. 计量与单位
    unit(hat{theta}) = unit(theta),dim(hat{theta}) = dim(theta);发布前执行 check_dim( y - f(x) )。
  5. 时间与到达时
    统计窗口:window( t; Delta_t, tau_mono );到达时两口径并行与 delta_form 记录。

III. 公设 P304-*


IV. 最小方程 S304-*

  1. S304-1(加权均值与方差)
    • ( hat{mu}_w = ( ∑ w_i y_i ) / ( ∑ w_i ) )。
    • 线性化方差 ( Var( hat{mu}_w ) ≈ ( ∑ w_i^2 ( y_i - hat{mu}_w )^2 ) / ( ( ∑ w_i )^2 ) )(SRS 近似;复杂设计见复制法)。
  2. S304-2(比例/率区间)
    • Wilson 比例区间:p_w = ( y + z^2 / 2 ) / ( n + z^2 ),half = z * sqrt( ( p_hat ( 1 - p_hat ) + z^2 / ( 4 n ) ) / ( n + z^2 ) ),CI = [ p_w - half , p_w + half ]。
    • 泊松率(暴露 E):lambda_hat = ( k / E ),正态近似区间 lambda_hat ± z * sqrt( k ) / E(小样本用精确或 Byar)。
  3. S304-3(Delta 方法)
    标量:Var( g( hat{theta} ) ) ≈ ( g'( theta ) )^2 Var( hat{theta} );向量:Var( g( hat{theta} ) ) ≈ G V G^T,G = ∂g/∂theta |_{hat{theta}}。
  4. S304-4(比率估计 Delta)
    R = A / B,Var( R ) ≈ ( 1 / B^2 ) Var( A ) + ( A^2 / B^4 ) Var( B ) - ( 2 A / B^3 ) Cov( A, B )。
  5. S304-5(GLM 正态近似区间)
    CI_{1-alpha}( theta_j ) = hat{theta}_j ± z_{1-alpha/2} * SE( hat{theta}_j );小样本用 t_{df}。
  6. S304-6(Bootstrap 区间)
    百分位:CI = [ q_{alpha/2}( theta^* ), q_{1-alpha/2}( theta^* ) ];BCa 作为默认稳健选项。
  7. S304-7(贝叶斯区间与覆盖因子)
    • 中心或 HPD:CI = [ q_{alpha/2}( p(theta|D) ), q_{1-alpha/2} ];
    • 计量映射:U = k * u_c 与频率学区间对齐,正态近似 k ≈ z_{1-alpha/2}。
  8. S304-8(后验预测检验)
    ppc = P( T( y_rep ) ≥ T( y_obs ) | D );发布需给出关键统计 T(·) 与 ppc 值。
  9. S304-9(到达时两口径差)
    delta_form = | ( 1 / c_ref ) * ( ∫ n_eff d ell ) - ( ∫ ( n_eff / c_ref ) d ell ) |,并断言 delta_form ≤ tol_Tarr。
  10. S304-10(多重比较接口占位)
    族级错误控制由第6章执行;本章区间宽度在给定 alpha_budget 下计算,alpha_used ≤ alpha_budget。

V. 统计流程 M30-4(就绪→估计→区间→诊断→发布)


VI. 契约与断言(C30-4xx)


VII. 实现绑定 I30-*


VIII. 交叉引用


IX. 质量与风控

  1. SLI/SLO
    覆盖度误差 | cov_hat - ( 1 - alpha ) |, 区间宽度 width_p50/p90, var_gap, mcse_p95, latency_ms_p99。
  2. 风控与回退
    • 触发:C30-402/403/405 失败或 rhat > cap_rhat。
    • 动作:回退稳健到复制或反之;降低发布等级为“实验”;退回上一签名清单并告警。

小结

本章以 P304-* 约束估计与区间的一致口径,给出 S304-* 的通用计算式,落实 M30-4 的发布流程与 C30-4xx 的质量闸门,并通过 I30-* 接口实现频率学与贝叶斯的一致化产出,为后续多重比较、漂移与因果评估提供稳定基座。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/