目录 / 文档-技术白皮书 / 18-EFT.WP.Methods.CrossStats v1.0
一句话目标:统一点估计、区间与不确定度的频率学与贝叶斯口径,明确权重、量纲与时基下的发布规则。
I. 范围与对象
- 范围
- 适用于加权样本、复杂抽样与在线流的点估计、区间估计与后验总结。
- 覆盖均值/比例/率、回归(GLM)、比率与函数型指标 g( theta ) 的不确定度传播。
- 对象
- 输入:数据 D = { (y_i, x_i, w_i, t_i) },抽样信息 pi(i) 或复制权重,窗口 Delta_t,到达时字段 T_arr。
- 输出:hat{theta}, SE(hat{theta}), CI_{1-alpha} 或后验区间,U = k * u_c,manifest.stats.estim.*。
- 约束:单位与量纲一致;sum(w_i)/N_hat ≈ 1;时间在 tau_mono 上评估、以 ts 发布。
II. 名词与变量
- 基本量
- theta(参数向量),hat{theta}(估计量),SE(标准误),V(协方差),CI_{1-alpha}(区间)。
- 加权均值:hat{mu}_w = ( ∑ w_i y_i ) / ( ∑ w_i )。
- 比率:R = ( ∑ w_i a_i ) / ( ∑ w_i b_i )。
- GLM 与稳健方差
- 评分方程:U( theta ) = ∑ x_i * ( y_i - mu_i( theta ) ) / v_i( theta ) = 0。
- 三明治方差:V_hat = ( A^{-1} ) * B * ( A^{-1} )^T,其中 A = - ∂U/∂theta, B = ∑ u_i u_i^T。
- 贝叶斯要素
p(theta), L(theta; D), p(theta | D) ∝ L * p(theta),后验预测 p(y_new | D) = ( ∫ p(y_new | theta) p(theta | D) d theta )。 - 计量与单位
unit(hat{theta}) = unit(theta),dim(hat{theta}) = dim(theta);发布前执行 check_dim( y - f(x) )。 - 时间与到达时
统计窗口:window( t; Delta_t, tau_mono );到达时两口径并行与 delta_form 记录。
III. 公设 P304-*
- P304-1(权重显式):任何加权估计必须提供 w_i 的生成口径与版本,且 sum(w_i)/N_hat ≈ 1。
- P304-2(量纲守恒):unit(expr) 与 dim(expr) 一致且可追溯;不允许隐式单位转换。
- P304-3(稳健方差优先):存在异方差/相关时,默认采用稳健或复制权重方差。
- P304-4(覆盖度可核):区间需给出目标覆盖度 1 - alpha 与实测覆盖近似或 PPC 结果。
- P304-5(时基一致):所有估计在 tau_mono 计算,以 ts 发布,携带 offset/skew/J。
- P304-6(到达时并行口径):涉及 T_arr 的估计,必须并行记录两口径与 delta_form,并断言阈值。
- P304-7(数值稳定):优化与采样需报告收敛准则、mcse 或迭代残差,不满足门限不得发布为“强口径”。
IV. 最小方程 S304-*
- S304-1(加权均值与方差)
- ( hat{mu}_w = ( ∑ w_i y_i ) / ( ∑ w_i ) )。
- 线性化方差 ( Var( hat{mu}_w ) ≈ ( ∑ w_i^2 ( y_i - hat{mu}_w )^2 ) / ( ( ∑ w_i )^2 ) )(SRS 近似;复杂设计见复制法)。
- S304-2(比例/率区间)
- Wilson 比例区间:p_w = ( y + z^2 / 2 ) / ( n + z^2 ),half = z * sqrt( ( p_hat ( 1 - p_hat ) + z^2 / ( 4 n ) ) / ( n + z^2 ) ),CI = [ p_w - half , p_w + half ]。
- 泊松率(暴露 E):lambda_hat = ( k / E ),正态近似区间 lambda_hat ± z * sqrt( k ) / E(小样本用精确或 Byar)。
- S304-3(Delta 方法)
标量:Var( g( hat{theta} ) ) ≈ ( g'( theta ) )^2 Var( hat{theta} );向量:Var( g( hat{theta} ) ) ≈ G V G^T,G = ∂g/∂theta |_{hat{theta}}。 - S304-4(比率估计 Delta)
R = A / B,Var( R ) ≈ ( 1 / B^2 ) Var( A ) + ( A^2 / B^4 ) Var( B ) - ( 2 A / B^3 ) Cov( A, B )。 - S304-5(GLM 正态近似区间)
CI_{1-alpha}( theta_j ) = hat{theta}_j ± z_{1-alpha/2} * SE( hat{theta}_j );小样本用 t_{df}。 - S304-6(Bootstrap 区间)
百分位:CI = [ q_{alpha/2}( theta^* ), q_{1-alpha/2}( theta^* ) ];BCa 作为默认稳健选项。 - S304-7(贝叶斯区间与覆盖因子)
- 中心或 HPD:CI = [ q_{alpha/2}( p(theta|D) ), q_{1-alpha/2} ];
- 计量映射:U = k * u_c 与频率学区间对齐,正态近似 k ≈ z_{1-alpha/2}。
- S304-8(后验预测检验)
ppc = P( T( y_rep ) ≥ T( y_obs ) | D );发布需给出关键统计 T(·) 与 ppc 值。 - S304-9(到达时两口径差)
delta_form = | ( 1 / c_ref ) * ( ∫ n_eff d ell ) - ( ∫ ( n_eff / c_ref ) d ell ) |,并断言 delta_form ≤ tol_Tarr。 - S304-10(多重比较接口占位)
族级错误控制由第6章执行;本章区间宽度在给定 alpha_budget 下计算,alpha_used ≤ alpha_budget。
V. 统计流程 M30-4(就绪→估计→区间→诊断→发布)
- 就绪
载入 w_i/replicate weights、设计信息与 Delta_t;执行 check_dim 与样本有效性 n_eff 评估。 - 估计
计算 hat{theta}(加权/GLM/比率);选择方差方案(稳健/复制/自助法)。 - 区间
构造 CI_{1-alpha}:优先稳健或复制方差;比例/率按适配口径;贝叶斯给出后验区间与 U = k * u_c 映射。 - 诊断
覆盖度或 PPC、残差与偏差-方差分析;记录 mcse 或迭代收敛;如涉及 T_arr,并行两口径与 delta_form。 - 发布
写入 manifest.stats.estim.*:口径、alpha, SE, CI, ppc/coverage, offset/skew/J, TraceID 与签名。
VI. 契约与断言(C30-4xx)
- C30-401(权重归一):| ( ∑ w_i / N_hat ) - 1 | ≤ tol_w_norm。
- C30-402(方差一致):复制与稳健方差差异比 | SE_rep - SE_robust | / SE_robust ≤ tol_var_gap。
- C30-403(覆盖度/ppc):离线回放覆盖误差 | cov_hat - ( 1 - alpha ) | ≤ tol_cov 或 ppc ∈ [tol_ppc_low, tol_ppc_high]。
- C30-404(数值稳定):mcse( theta_j ) ≤ tol_mcse 或优化残差 ≤ tol_opt。
- C30-405(到达时差):delta_form ≤ tol_Tarr。
- C30-406(量纲守恒):assert check_dim( y - f(x) ) == true;单位缺失即为违规。
- C30-407(多重比较预算):alpha_used ≤ alpha_budget(与第6章联动)。
VII. 实现绑定 I30-*
- I30-41 fit_glm(ds, formula, family, variance="robust") -> {hat_theta, V_hat, SE}
支持 family ∈ {gaussian, binomial, poisson, gamma},variance ∈ {model, robust, cluster, replicate}。 - I30-42 fit_bayes(ds, model_spec, priors, draws, chains) -> posterior
返回后验样本、mcse、rhat、HPD 与 PPC;附采样种子与版本。 - I30-43 bootstrap_metric(fn, ds, B, scheme) -> {est, SE, CI}
scheme ∈ {pairs, residual, wild},支持加权与分层抽样。 - I30-44 delta_propagate(g, hat_theta, V_hat) -> {est_g, SE_g, CI_g}
自动生成雅可比 G 并计算 G V G^T。 - I30-45 compose_interval(est, SE, alpha, mode) -> CI
mode ∈ {normal, t, wilson, byar, bca}。 - I30-46 emit_estimation_manifest(results, policy) -> manifest.stats.estim
写入契约评估、口径、阈值与签名;与 manifest.stats.sampling 关联。
VIII. 交叉引用
- 抽样与权重来源:见本卷第3章。
- 多重比较与序贯控制:见本卷第6章。
- 漂移监测与基线更新:见本卷第7章。
- 时间轴与 T_arr 两口径:见《Methods.Cleaning v1.0》第5–6章。
- 计量与单位一致:见《Methods.Cleaning v1.0》第4章。
IX. 质量与风控
- SLI/SLO
覆盖度误差 | cov_hat - ( 1 - alpha ) |, 区间宽度 width_p50/p90, var_gap, mcse_p95, latency_ms_p99。 - 风控与回退
- 触发:C30-402/403/405 失败或 rhat > cap_rhat。
- 动作:回退稳健到复制或反之;降低发布等级为“实验”;退回上一签名清单并告警。
小结
本章以 P304-* 约束估计与区间的一致口径,给出 S304-* 的通用计算式,落实 M30-4 的发布流程与 C30-4xx 的质量闸门,并通过 I30-* 接口实现频率学与贝叶斯的一致化产出,为后续多重比较、漂移与因果评估提供稳定基座。版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/