目录 / 文档-技术白皮书 / 18-EFT.WP.Methods.CrossStats v1.0
一句话目标:以加权、窗口化与到达时一致的统一口径,给出点估计、区间与序贯决策中的误差分解与不确定度传播规则,并映射至 C30-* 契约与 manifest.stats.* 字段。
I. 范围与对象
- 覆盖测量误差、抽样误差、模型误差与漂移引入的统计不确定度,适用于分类/回归/排序/校准/因果与时序面板。
- 计算一律在 tau_mono 上评估,在 ts 上发布,附带 offset/skew/J 与 T_arr 两口径 delta_form(见《Methods.Cleaning v1.0》与本卷第11章)。
II. 名词与变量
- 样本与权重:D = { (x_i, y_i, w_i) }, N, w_i > 0, W = ( ∑ w_i )。
- 参数与估计:theta, hat{theta}, Sigma_theta, SE = sqrt( diag(Sigma_theta) )。
- 协方差与雅可比:Sigma_x, J = ( ∂g / ∂x ) |_{hat{x}},g(x) 为目标函数或指标映射。
- 标准不确定度与覆盖不确定度:u(x), u_c, U = k * u_c(k 为覆盖因子)。
- 到达时与时间:T_arr, delta_form, tau_mono, ts, Delta_t。
- 单位与量纲:unit(z), dim(z), check_dim(expr)。
III. 公设 P30E-*
- P30E-1(分解与合并):u_c^2 = u_rand^2 + u_sys^2,其中 u_sys 来自偏置或标定链映射。
- P30E-2(带权口径):若存在抽样或分层,默认使用权重 w_i 的加权估计与重采样。
- P30E-3(量纲守恒):任何传播前后均执行 check_dim( y - f(x,theta) )。
- P30E-4(到达时一致):涉及窗口化或时延估计的传播,必须记录 T_arr 两口径与 delta_form,并断言 delta_form ≤ tol_Tarr。
- P30E-5(相关性显式):传播时显式使用 Sigma,不得以独立性为隐式假设。
- P30E-6(证据可追溯):重采样/蒙特卡洛须记录随机种子、样本选择与收敛诊断,并落盘 repro_hash 与 signature。
IV. 最小方程 S30E-*
- S30E-1(线性化传播,标量)
u_c^2(y) = ( ∂g / ∂x )^2 * u^2(x),对多输入推广为雅可比形式。 - S30E-2(线性化传播,向量)
u_c^2(y) = J_x Sigma_x J_x^T,其中 J_x = ∂g / ∂x。 - S30E-3(含参数不确定度)
u_c^2(y) = J_x Sigma_x J_x^T + J_theta Sigma_theta J_theta^T + 2 * J_x Cov(x,theta) J_theta^T。 - S30E-4(加权均值与方差)
mean_w = ( ∑ w_i z_i ) / W;var_w = ( ∑ w_i ( z_i - mean_w )^2 ) / W;SE(mean_w) = sqrt( var_w / n_eff ),n_eff = ( W^2 ) / ( ∑ w_i^2 )。 - S30E-5(比值与乘积的 Delta 法)
u_c^2( a / b ) ≈ ( u^2(a) / b^2 ) + ( a^2 u^2(b) / b^4 ) - ( 2 a Cov(a,b) / b^3 );
u_c^2( a * b ) ≈ b^2 u^2(a) + a^2 u^2(b) + 2ab Cov(a,b)。 - S30E-6(全概率误差分解)
Var(Y) = E[ Var(Y|X) ] + Var( E[Y|X] ),用于窗口/分组合并不确定度。 - S30E-7(覆盖不确定度)
U = k * u_c;k 依据目标覆盖度与自由度选择(正态或 Student-t)。 - S30E-8(自助法标准误)
u_c( hat{theta} ) ≈ std( { hat{theta}^{(b)} }_{b=1..B} );区间可取百分位或 BCa。 - S30E-9(后验不确定度)
u_c( g(theta) ) ≈ std( { g(theta^{(s)}) }_{s=1..S} );区间由 q_{alpha/2}, q_{1-alpha/2} 给出。 - S30E-10(时序相关修正)
Var( mean ) ≈ gamma(0) + 2 * ( ∑_{h=1}^{H} ( 1 - h/T ) gamma(h) ) / T 或使用 Newey-West。 - S30E-11(设计效应)
DEFF = var_complex / var_SRS;发布 SE_adj = sqrt( DEFF ) * SE_SRS。
V. 传播路径与组合规则(工程口径)
- 发布层:计算覆盖度 U = k * u_c,并将 U, u_c、方法与证据写入 manifest.stats.*。
- 聚合层:跨窗口/分组使用 S30E-6 合并,或用层级模型(见第12章)共享不确定度。
- 映射层:指标 m = g( x, hat{theta} ),用 S30E-2/3/5 合成 u_c(m)。
- 估计层:对 hat{theta} = argmin loss(D; theta),以 sandwich 或 Fisher 信息得到 Sigma_theta。
- 清洗与对齐层:应用 standardize_names, repair_units, align_timebase;传播 offset/skew/J 对时延敏感指标的影响,记录 T_arr 两口径与 delta_form。
- 源测量层:获取 u(x_src) 与标定地图 map_calib,形成 u_sys 与 u_rand 的初值。
VI. 重采样与贝叶斯蒙特卡洛
- 重采样(带权):对每个自助重复 b,从权重归一的经验分布抽样索引或使用 Poisson 自助;产出 { m^{(b)} } 与 u_c = std( m^{(b)} )。
- 区间:
- 百分位区间:[ q_{alpha/2}, q_{1-alpha/2} ]。
- BCa:修正偏度与加速项;发布 B、z0、a。
- 贝叶斯:从后验样本 { theta^{(s)} } 传播至指标 { g(theta^{(s)}) };报告收敛诊断与有效样本量 ESS。
- 序贯/流式:使用滑动窗口自助或块自助;或采用 alpha 花费规划保持覆盖与错误率一致(与第6、8章一致)。
VII. 相关性与协方差处理
- 多源联合:构造块协方差
Sigma = [ Sigma_x Cov(x,theta) ; Cov(theta,x) Sigma_theta ],用 S30E-3 传播。 - 多窗口相关:Newey-West、HAC 或块自助修正均值与比值类统计量的方差。
- 多指标联合区间:对向量 m 发布椭球区域
{ ( m - hat{m} )^T Sigma_m^{-1} ( m - hat{m} ) ≤ c_alpha },并给出 Sigma_m 估计口径。
VIII. 指标、区间与覆盖度发布口径
- 分类/回归/排序指标的 SE 与区间:按 S30E-2/8/9/10 选择线性化、自助或贝叶斯口径,并声明方法。
- 校准与概率输出:ECE/Brier/NLL 的不确定度以分箱自助或再拟合法给出;避免将阈值选择误差遗漏。
- 因果效应:ATE/ATT/CATE 的不确定度优先使用稳健(双稳健)方差或半参数影响函数;报告重叠性诊断与权重极值约束。
IX. 时间窗口与到达时一致化
- 窗口定义:Window_k = [ tau_k, tau_k + Delta_t );发布 Delta_t, step, n_eff(Window_k)。
- 时延/抖动传播:若指标 m 对到达时敏感,近似 u_c^2(m) += ( ∂m / ∂T_arr )^2 * u^2(T_arr ),并并行记录两口径差 delta_form。
- 度量回放:基于 EWMA 或分位基线时,发布基线不确定度并以 S30E-6 合成总不确定度。
X. 契约与清单映射
- 契约(示例):
- C30-520 覆盖度:target_coverage ≥ 1 - alpha ± tol_cov。
- C30-521 区间宽度护栏:width ≤ width_max。
- C30-522 线性化适用性:max| second_order_term | ≤ tol_delta。
- C30-523 权重归一:| ( ∑ w_i ) / N - 1 | ≤ tol_w。
- C30-524 到达时一致:delta_form ≤ tol_Tarr。
- 清单字段:
- manifest.stats.u.method ∈ {delta, sandwich, bootstrap, bayes, HAC}。
- manifest.stats.u.values.{uc,U,k};manifest.stats.u.components.{rand,sys}。
- manifest.stats.time.{Delta_t, step, offset, skew, J, Tarr_forms, delta_form}。
- contracts[*].rule, contracts[*].result, contracts[*].evidence_hash。
XI. 实现绑定 I30-E-*
- propagate_uncertainty_delta(est, Sigma_x, jacobians) -> {uc, U}
- sandwich_var(model, ds, weights, hac) -> Sigma_theta
- bootstrap_metric(fn, ds, weights, B, scheme) -> {samples, uc, CI}
- bayes_mc_posterior(model_spec, priors, draws) -> {samples, uc, CI}
- block_bootstrap_ts(stream, block_len, B) -> {uc, CI}
- combine_components(u_rand, u_sys, k) -> {uc, U}
- emit_uncertainty_manifest(results, policy) -> manifest.stats.u
不变量:Sigma 半正定;k > 0;sum(w_i)/N ≈ 1;窗口不重叠或重叠策略已记载;delta_form ≤ tol_Tarr。
XII. 审计与可追溯
- 记录:抽样/自助策略、随机种子、B/S、收敛诊断、核/带宽、分箱与分位、HAC 阶数、block_len、雅可比与梯度近似方式。
- 追溯:repro_hash = hash_sha256(code ∥ params ∥ data_fingerprint),并以 signature 签名;落盘 unit/dim 校核结果与失败样本示例 TraceID。
小结
本附录给出线性化、重采样与贝叶斯三类传播主路,并将时间与到达时因素纳入同一不确定度闭环;所有输出对齐 C30-* 契约与 manifest.stats.*,确保跨模态、跨系统的一致发布与可审计可回放。版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/