目录 / 文档-技术白皮书 / 18-EFT.WP.Methods.CrossStats v1.0
一句话目标:确立频率学与贝叶斯的一致化基线,规范抽样、估计与不确定度的最小公设 P302-* 与可复用方程族 S302-*,作为全卷引用锚点。
I. 范围与对象
- 范围
- 适用于批量与事件流的描述统计、参数估计、区间/后验、稳健方差、序贯判决与到达时相关的窗口化统计。
- 在 tau_mono 上计算,在 ts 上发布;凡涉 T_arr 必并行两口径并记录 delta_form。
- 对象
数据 D = { (x_i, y_i, t_i, w_i, m_i) },模型参数 theta,先验 p(theta),似然 L(theta;D),统计窗口 Delta_t,契约策略 policy。
II. 名词与变量
- 抽样与权重:pi(i)(纳入概率),w_i = 1 / pi(i),W_norm = ( ∑ w_i ) / N,n_eff = ( ∑ w_i )^2 / ( ∑ w_i^2 )。
- 估计与不确定度:hat{theta}, SE, CI, U = k * u_c。
- 时基与到达时:tau_mono, ts, offset/skew/J, T_arr 两口径:
T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell ),T_arr = ( ∫ ( n_eff / c_ref ) d ell ),差异 delta_form。 - 信息与诊断:I(theta)(Fisher 信息),H(Hessian),s_i(单点 score),ppc(posterior predictive check)。
III. 公设 P302-*
- P302-1(可交换/分层可交换):同一设计层内样本视为可交换;跨层以权重或层级模型处理。
- P302-2(抽样框一致与权重显式):任何加权估计必须说明 pi(i) 生成方式与版本,保留 w_i 元数据与归一化因子。
- P302-3(量纲守恒):跨模态聚合前执行 check_dim(expr),单位修复失败映射为契约违规。
- P302-4(时基一体化):统计窗口在 tau_mono 上评估,对外 ts 发布,附 offset/skew/J。
- P302-5(到达时两口径并行):凡涉及到达时或传播延迟的统计,必须计算两口径并断言 delta_form ≤ tol_Tarr。
- P302-6(先验显式与可解释):贝叶斯分析须给出 p(theta) 的动机与灵敏度分析。
- P302-7(稳健与诊断):默认提供稳健方差(sandwich)与后验预测检查;序贯与多重比较消耗统一记账。
- P302-8(缺失机制声明):缺失以 m_i ∈ {0,1} 标注,缺失机制假设(MCAR/MAR/MNAR)与插补策略需显式记录,禁止隐式填值。
IV. 最小方程 S302-*
- S302-1(加权对数似然与 score):
ell(theta) = ∑_i w_i * log p( y_i | x_i; theta );
U(theta) = ∂ ell(theta) / ∂ theta = ∑_i w_i * ∂ log p( y_i | x_i; theta ) / ∂ theta;
hat{theta} 满足 U(hat{theta}) = 0。 - S302-2(Fisher 信息与渐近正态):
I(theta) = - E[ ∂^2 ell(theta) / ∂ theta ∂ theta^T ];
hat{theta} ~ approx Normal( theta, I(theta)^{-1} )(权重情形以设计或复制法校正)。 - S302-3(sandwich 稳健协方差):
H = - ∑_i w_i * ∂^2 log p_i / ∂ theta ∂ theta^T;
S = ∑_i w_i^2 * s_i * s_i^T,其中 s_i = ∂ log p_i / ∂ theta;
Var_robust( hat{theta} ) = H^{-1} * S * ( H^{-1} )^T。 - S302-4(GLM 评分方程,统一记号):
g( mu_i ) = x_i^T beta,mu_i = E[ Y_i | x_i ];
U(beta) = X^T W ( y - mu ) = 0(W 含 w_i 与方差函数与链接导数因子)。 - S302-5(贝叶斯后验与后验预测):
p(theta | D) = k * L(theta; D) * p(theta),k 为归一常数;
p( y_new | x_new, D ) = ( ∫ p( y_new | x_new, theta ) * p( theta | D ) d theta )。 - S302-6(Delta 方法):
Var( g( hat{theta} ) ) ≈ ( ∇g( theta ) )^T Var( hat{theta} ) ( ∇g( theta ) )。 - S302-7(区间与覆盖度):
频率学区间:CI_{1-α} = hat{theta} ± z_{1-α/2} * SE( hat{theta} );
贝叶斯区间:CI_{1-α} = [ q_{α/2}( p(theta|D) ), q_{1-α/2}( p(theta|D) ) ]。 - S302-8(窗口化统计):
hat{mu}_w( t; Delta_t ) = ( ∑_{i: |tau_i - t| ≤ Delta_t/2} w_i y_i ) / ( ∑_{i: |tau_i - t| ≤ Delta_t/2} w_i )。 - S302-9(两样本效应与样本量近似):
均值差 delta = mu_A - mu_B,方差近似 Var( delta ) = sigma_A^2 / n_A + sigma_B^2 / n_B;
等量方差、等样本量时 n_per_arm ≈ ( 2 * ( z_{1-α/2} + z_{power} )^2 * sigma^2 ) / delta^2。 - S302-10(序贯 GLR 统计量与停序):
Lambda_t = ( sup_{theta ∈ H1} L_t( theta ) ) / ( sup_{theta ∈ H0} L_t( theta ) );
tau = inf { t : log Lambda_t ≥ h_1 or log Lambda_t ≤ - h_0 }。 - S302-11(漂移度量基式):
KL( P_ref || P_cur ) = ( ∫ p_ref * log( p_ref / p_cur ) dx );
W1( P_ref, P_cur ) = ( ∫ | F_ref(x) - F_cur(x) | dx );
psi = ( ∑ bins ( p_cur - p_ref ) * log( p_cur / p_ref ) )(离散近似)。
V. 统计流程 M30-2(基线估计→诊断→发布)
- 就绪
校核单位与量纲;对齐 tau_mono;加载权重策略并归一 W_norm ≈ 1;定义 H0/H1 与 alpha/power 或先验 p(theta)。 - 估计
解 U( hat{theta} ) = 0 或生成后验样本;计算 SE、Var_robust 或后验分位;窗口化指标在 Delta_t 上评估。 - 诊断
分析 H 条件数、score 近零性;稳健与模型方差对比;后验 ppc 与收敛诊断;序贯或多重比较的 alpha 消耗记录。 - 发布
产出 CI/posterior、决策与日志;并行记录 T_arr 两口径与 delta_form;落盘 manifest.stats.* 并签名冻结。
VI. 契约与断言
- C30-21(权重口径):| W_norm - 1 | ≤ tol_w_norm;max(w_i) / median(w_i) ≤ cap_w_max。
- C30-22(Hessian 与可识别性):H 正定且 cond(H) ≤ cap_cond;|| U( hat{theta} ) || ≤ tol_score。
- C30-23(覆盖度/功效):离线回放覆盖度 |cov - target_cov| ≤ tol_cov;在线 alpha_spent ≤ alpha_budget。
- C30-24(贝叶斯诊断):Rhat ≤ cap_rhat,ESS/N ≥ min_ess_ratio,ppc_fail_rate ≤ tol_ppc。
- C30-25(到达时差):delta_form ≤ tol_Tarr;窗口覆盖度 cov_rate ≥ tol_window_cover。
VII. 实现绑定 I30-*
- I30-41 fit_glm(ds, formula, family) -> model:返回 hat{theta}, SE, Var_robust, 诊断与残差;不变量 cond(H) ≤ cap_cond。
- I30-42 fit_bayes(ds, model_spec, priors) -> posterior:返回样本、摘要、ppc 与诊断;不变量 Rhat ≤ cap_rhat。
- I30-43 bootstrap_metric(fn, ds, B) -> {est, CI}:BCa 或百分位法;不变量 B ≥ B_min。
- I30-44 sequential_glrt(stream, H0, H1, h) -> stop_time:返回 tau, 决策与 alpha_spent。
- I30-45 emit_stats_manifest(results, policy) -> manifest.stats:写入契约结果、阈值、TraceID 与签名。
VIII. 交叉引用
- 模式绑定与单位修复:见《Methods.Cleaning v1.0》第3/4章。
- 时间轴与到达时:见《Methods.Cleaning v1.0》第5/6章。
- 漂移监测与告警:见本卷第7章;实验设计:见第8章;因果推断:见第10章。
- 成像质量映射与度量:见《Methods.Imaging v1.0》第14章。
IX. 质量与风控
- SLI/SLO
估计延迟 latency_ms_p99,覆盖度偏差,稳健与模型方差比,alpha_spent/alpha_budget,Rhat 未达标率。 - 回退
契约失败触发回退到上一签名 manifest.stats;保留 TraceID 与运行环境摘要。
小结
本章固化了抽样、估计与不确定度传播的共通基线:P302-* 与 S302-*。后续章节在此基础上扩展到复杂抽样、重采样与交叉验证、错误控制、漂移、A/B 与因果等主题,并复用本章的契约与实现绑定接口。版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/