18-EFT.WP.Methods.CrossStats v1.0 | 第4章估计与区间（频率学/贝叶斯一致化）

目录／文档-技术白皮书（V5.05）／ 18-EFT.WP.Methods.CrossStats v1.0

第4章估计与区间（频率学/贝叶斯一致化）

一句话目标：统一点估计、区间与不确定度的频率学与贝叶斯口径，明确权重、量纲与时基下的发布规则。

I. 范围与对象

范围
- 适用于加权样本、复杂抽样与在线流的点估计、区间估计与后验总结。
- 覆盖均值/比例/率、回归（GLM）、比率与函数型指标 g( theta ) 的不确定度传播。
对象
- 输入：数据 D = { (y_i, x_i, w_i, t_i) }，抽样信息 pi(i) 或复制权重，窗口 Delta_t，到达时字段 T_arr。
- 输出：hat{theta}, SE(hat{theta}), CI_{1-alpha} 或后验区间，U = k * u_c，manifest.stats.estim.*。
- 约束：单位与量纲一致；sum(w_i)/N_hat ≈ 1；时间在 tau_mono 上评估、以 ts 发布。

II. 名词与变量

基本量
- theta（参数向量），hat{theta}（估计量），SE（标准误），V（协方差），CI_{1-alpha}（区间）。
- 加权均值：hat{mu}_w = ( ∑ w_i y_i ) / ( ∑ w_i )。
- 比率：R = ( ∑ w_i a_i ) / ( ∑ w_i b_i )。
GLM 与稳健方差
- 评分方程：U( theta ) = ∑ x_i * ( y_i - mu_i( theta ) ) / v_i( theta ) = 0。
- 三明治方差：V_hat = ( A^{-1} ) * B * ( A^{-1} )^T，其中 A = - ∂U/∂theta, B = ∑ u_i u_i^T。
贝叶斯要素
p(theta), L(theta; D), p(theta | D) ∝ L * p(theta)，后验预测 p(y_new | D) = ( ∫ p(y_new | theta) p(theta | D) d theta )。
计量与单位
unit(hat{theta}) = unit(theta)，dim(hat{theta}) = dim(theta)；发布前执行 check_dim( y - f(x) )。
时间与到达时
统计窗口：window( t; Delta_t, tau_mono )；到达时两口径并行与 delta_form 记录。

III. 公设 P304-*

P304-1（权重显式）：任何加权估计必须提供 w_i 的生成口径与版本，且 sum(w_i)/N_hat ≈ 1。
P304-2（量纲守恒）：unit(expr) 与 dim(expr) 一致且可追溯；不允许隐式单位转换。
P304-3（稳健方差优先）：存在异方差/相关时，默认采用稳健或复制权重方差。
P304-4（覆盖度可核）：区间需给出目标覆盖度 1 - alpha 与实测覆盖近似或 PPC 结果。
P304-5（时基一致）：所有估计在 tau_mono 计算，以 ts 发布，携带 offset/skew/J。
P304-6（到达时并行口径）：涉及 T_arr 的估计，必须并行记录两口径与 delta_form，并断言阈值。
P304-7（数值稳定）：优化与采样需报告收敛准则、mcse 或迭代残差，不满足门限不得发布为“强口径”。

IV. 最小方程 S304-*

S304-1（加权均值与方差）
- ( hat{mu}_w = ( ∑ w_i y_i ) / ( ∑ w_i ) )。
- 线性化方差 ( Var( hat{mu}_w ) ≈ ( ∑ w_i^2 ( y_i - hat{mu}_w )^2 ) / ( ( ∑ w_i )^2 ) )（SRS 近似；复杂设计见复制法）。
S304-2（比例/率区间）
- Wilson 比例区间：p_w = ( y + z^2 / 2 ) / ( n + z^2 )，half = z * sqrt( ( p_hat ( 1 - p_hat ) + z^2 / ( 4 n ) ) / ( n + z^2 ) )，CI = [ p_w - half , p_w + half ]。
- 泊松率（暴露 E）：lambda_hat = ( k / E )，正态近似区间 lambda_hat ± z * sqrt( k ) / E（小样本用精确或 Byar）。
S304-3（Delta 方法）
标量：Var( g( hat{theta} ) ) ≈ ( g'( theta ) )^2 Var( hat{theta} )；向量：Var( g( hat{theta} ) ) ≈ G V G^T，G = ∂g/∂theta |_{hat{theta}}。
S304-4（比率估计 Delta）
R = A / B，Var( R ) ≈ ( 1 / B^2 ) Var( A ) + ( A^2 / B^4 ) Var( B ) - ( 2 A / B^3 ) Cov( A, B )。
S304-5（GLM 正态近似区间）
CI_{1-alpha}( theta_j ) = hat{theta}_j ± z_{1-alpha/2} * SE( hat{theta}_j )；小样本用 t_{df}。
S304-6（Bootstrap 区间）
百分位：CI = [ q_{alpha/2}( theta^* ), q_{1-alpha/2}( theta^* ) ]；BCa 作为默认稳健选项。
S304-7（贝叶斯区间与覆盖因子）
- 中心或 HPD：CI = [ q_{alpha/2}( p(theta|D) ), q_{1-alpha/2} ]；
- 计量映射：U = k * u_c 与频率学区间对齐，正态近似 k ≈ z_{1-alpha/2}。
S304-8（后验预测检验）
ppc = P( T( y_rep ) ≥ T( y_obs ) | D )；发布需给出关键统计 T(·) 与 ppc 值。
S304-9（到达时两口径差）
delta_form = | ( 1 / c_ref ) * ( ∫ n_eff d ell ) - ( ∫ ( n_eff / c_ref ) d ell ) |，并断言 delta_form ≤ tol_Tarr。
S304-10（多重比较接口占位）
族级错误控制由第6章执行；本章区间宽度在给定 alpha_budget 下计算，alpha_used ≤ alpha_budget。

V. 统计流程 M30-4（就绪→估计→区间→诊断→发布）

就绪
载入 w_i/replicate weights、设计信息与 Delta_t；执行 check_dim 与样本有效性 n_eff 评估。
估计
计算 hat{theta}（加权/GLM/比率）；选择方差方案（稳健/复制/自助法）。
区间
构造 CI_{1-alpha}：优先稳健或复制方差；比例/率按适配口径；贝叶斯给出后验区间与 U = k * u_c 映射。
诊断
覆盖度或 PPC、残差与偏差-方差分析；记录 mcse 或迭代收敛；如涉及 T_arr，并行两口径与 delta_form。
发布
写入 manifest.stats.estim.*：口径、alpha, SE, CI, ppc/coverage, offset/skew/J, TraceID 与签名。

VI. 契约与断言（C30-4xx）

C30-401（权重归一）：| ( ∑ w_i / N_hat ) - 1 | ≤ tol_w_norm。
C30-402（方差一致）：复制与稳健方差差异比 | SE_rep - SE_robust | / SE_robust ≤ tol_var_gap。
C30-403（覆盖度/ppc）：离线回放覆盖误差 | cov_hat - ( 1 - alpha ) | ≤ tol_cov 或 ppc ∈ [tol_ppc_low, tol_ppc_high]。
C30-404（数值稳定）：mcse( theta_j ) ≤ tol_mcse 或优化残差 ≤ tol_opt。
C30-405（到达时差）：delta_form ≤ tol_Tarr。
C30-406（量纲守恒）：assert check_dim( y - f(x) ) == true；单位缺失即为违规。
C30-407（多重比较预算）：alpha_used ≤ alpha_budget（与第6章联动）。

VII. 实现绑定 I30-*

I30-41 fit_glm(ds, formula, family, variance="robust") -> {hat_theta, V_hat, SE}
支持 family ∈ {gaussian, binomial, poisson, gamma}，variance ∈ {model, robust, cluster, replicate}。
I30-42 fit_bayes(ds, model_spec, priors, draws, chains) -> posterior
返回后验样本、mcse、rhat、HPD 与 PPC；附采样种子与版本。
I30-43 bootstrap_metric(fn, ds, B, scheme) -> {est, SE, CI}
scheme ∈ {pairs, residual, wild}，支持加权与分层抽样。
I30-44 delta_propagate(g, hat_theta, V_hat) -> {est_g, SE_g, CI_g}
自动生成雅可比 G 并计算 G V G^T。
I30-45 compose_interval(est, SE, alpha, mode) -> CI
mode ∈ {normal, t, wilson, byar, bca}。
I30-46 emit_estimation_manifest(results, policy) -> manifest.stats.estim
写入契约评估、口径、阈值与签名；与 manifest.stats.sampling 关联。

VIII. 交叉引用

抽样与权重来源：见本卷第3章。
多重比较与序贯控制：见本卷第6章。
漂移监测与基线更新：见本卷第7章。
时间轴与 T_arr 两口径：见《Methods.Cleaning v1.0》第5–6章。
计量与单位一致：见《Methods.Cleaning v1.0》第4章。

IX. 质量与风控

SLI/SLO
覆盖度误差 | cov_hat - ( 1 - alpha ) |, 区间宽度 width_p50/p90, var_gap, mcse_p95, latency_ms_p99。
风控与回退
- 触发：C30-402/403/405 失败或 rhat > cap_rhat。
- 动作：回退稳健到复制或反之；降低发布等级为“实验”；退回上一签名清单并告警。

小结

本章以 P304-* 约束估计与区间的一致口径，给出 S304-* 的通用计算式，落实 M30-4 的发布流程与 C30-4xx 的质量闸门，并通过 I30-* 接口实现频率学与贝叶斯的一致化产出，为后续多重比较、漂移与因果评估提供稳定基座。

版权与许可：除另有说明外，《能量丝理论》（含文本、图表、插图、符号与公式）的著作权由作者（屠广林）享有。
许可方式（CC BY 4.0）：在注明作者与来源的前提下，允许复制、转载、节选、改编与再分发。
署名格式（建议）：作者：屠广林｜作品：《能量丝理论》｜来源：energyfilament.org｜许可证：CC BY 4.0
验证召集： 作者独立自费、无雇主无资助；下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地，不限国家。欢迎各国媒体与同行抓住窗口组织验证，并与我们联系。
版本信息： 首次发布：2025-11-11 ｜当前版本：v6.0+5.05