目录文档-技术白皮书05-EFT.WP.Core.Errors v1.0

第2章 残差模型与稳健估计


I. 定义与基本口径


II. 稳健损失 rho 与影响函数 psi

  1. 定义:rho(e; hyper) 为无量纲损失,psi(e) def= d rho / d e 为影响函数,权函数 w_psi(e) def= psi(e) / e(当 e = 0 时取极限值)。
  2. 家族汇总(kind ∈ {"L2","L1","Huber","Tukey","StudentT"}):
    • L2:rho(e) = 0.5 * e^2;psi(e) = e;w_psi(e) = 1。
    • L1:rho(e) = |e|;psi(e) = sign(e)(e = 0 处子梯度 in [-1,1]);w_psi(e) approx 1 / max(|e|, epsilon)。
    • Huber(delta):
      1. 若 |e| ≤ delta:rho = 0.5 * e^2,psi = e;
      2. 若 |e| > delta:rho = delta * ( |e| - 0.5 * delta ),psi = delta * sign(e);
      3. w_psi(e) = min(1, delta / |e|)。
    • Tukey(c)(bisquare):
      1. 若 |e| < c:rho = (c^2 / 6) * [ 1 - ( 1 - (e/c)^2 )^3 ],psi = e * ( 1 - (e/c)^2 )^2;
      2. 若 |e| ≥ c:rho = c^2 / 6,psi = 0;
      3. w_psi(e) = ( 1 - (e/c)^2 )^2(区间内)。
    • StudentT(nu)(重尾,nu > 0):
      1. rho = 0.5 * (nu + 1) * log( 1 + (e^2)/nu );
      2. psi = ( (nu + 1) * e ) / ( nu + e^2 );
      3. w_psi(e) = (nu + 1) / ( nu + e^2 )。
  3. 超参数经验口径:Huber(delta ≈ 1.345) 与 Tukey(c ≈ 4.685) 在高斯下具 ≈95% 效率;StudentT(nu ∈ [3,8]) 适配 5%–15% 污染。

III. 稳健尺度 s 与标准化


IV. 加权—稳健等价与 IRLS 流程 M72-1

  1. 等价关系(恒等):对任意 rho,存在 w_psi(e) 使得
    argmin_theta ∑_i rho( r_i / s ) 与 argmin_theta ∑_i w_i * r_i^2 等价,
    其中 w_i = w_base_i * w_psi( r_i / s ),w_base_i = 1 / sigma_i^2(若未知取 1)。
  2. 迭代重加权最小二乘(IRLS):
    • 初始化 theta^(0)(如 MLE/L2),估计 s^(0) = s_MAD。
    • 计算残差 r(theta^(k)) 与标准化 e = r / s^(k)。
    • 权重更新:w_i^(k) = w_base_i * w_psi( e_i )。
    • 高斯—牛顿步:解 ( J^T W J + lambda * I ) * Δ = J^T W r,更新 theta^(k+1) = theta^(k) + Δ。
    • 尺度更新:用 s_MAD 或 Huber 尺度得到 s^(k+1)。
    • 收敛判据:||Δ|| / (||theta|| + eps) < tol 或 |J_R^(k+1) - J_R^(k)| / J_R^(k) < tol。
    • 产出:theta_hat、s_hat、权重 w、诊断量 e、chi2 = r^T R r。
  3. 数值注意:L1 在 e ≈ 0 处采用 w_psi(e) = 1 / max(|e|, epsilon);lambda 采用信赖域或 Levenberg–Marquardt 策略。

V. 重尾模型 StudentT 的 MLE 与梯度

  1. 对数似然(负号省略常数):ℓ(theta, s, nu) = - ∑_i 0.5*(nu+1) * log( 1 + (e_i^2)/nu ) - n * log(s),e_i = r_i / s。
  2. 一阶条件:
    • 对 theta:∂ℓ/∂theta ≈ J^T * W_T * r / s^2,其中 W_T = diag( (nu+1)/(nu + e^2) )。
    • 对 s:∂ℓ/∂s = -n/s + (1/s) * ∑_i ( (nu+1) * e_i^2 ) / ( nu + e_i^2 )。
    • nu 可固定或用网格/EM 更新。
  3. 与 IRLS 一致:W_T 即 w_psi 的重尾权。

VI. 异方差与权重建模


VII. 到达时 T_arr 场景(跨卷一致性示例)

  1. 模型口径一(常量外提):T_arr = ( 1 / c_ref ) * ( ∫_gamma n_eff d ell )。
  2. 模型口径二(一般):T_arr = ( ∫_gamma ( n_eff / c_ref ) d ell )。
  3. 残差:r_T def= y_T - T_arr(x; theta),须显式声明路径 gamma(ell) 与测度 d ell。
  4. 标准化与权重:
    • 若报告不确定度 U_T,取 sigma_T approx U_T / k,e_T = r_T / sigma_T;
    • 权重 w_T = w_psi(e_T) / sigma_T^2 并入 R。
  5. 合规检查:任何混用两口径或遗漏路径/测度时,触发 E-INT-ARR-003;若 ( n_eff / c_ref ) * d ell 未无量纲化,触发 E-MET-DIM-001。

VIII. 参量协方差与不确定度链接

  1. 高斯近似:Cov_theta approx s^2 * ( J^T W J )^-1。
  2. Sandwich 近似(稳健):Cov_theta approx A^-1 * B * A^-1,其中
    • A def= J^T W J;
    • B def= J^T * diag( psi(e)^2 ) * J / s^2(approx)。
  3. 输出映射不确定度:对测量量 g(theta),u_c^2(g) approx ( ∂g/∂theta ) * Cov_theta * ( ∂g/∂theta )^T;扩展不确定度 U = k * u_c(与《Core.Metrology》第5章口径一致)。

IX. 超参数选择与模型比较

  1. 经验默认:Huber(delta=1.345)、Tukey(c=4.685)、StudentT(nu=5)。
  2. 选择准则:
    • 最小化稳健尺度 s 或稳健 AIC(以 ∑ rho(e) 近似负对数似然);
    • 交叉验证:以 RMSE、MAE、median(|r|)、s 综合;
    • 离群占比 > 10% 时倾向 Tukey 或 StudentT。
  3. 早停与再权重:若 max_i |e_i| 在迭代中持续上升,降低 lambda 并重置尺度。

X. 实现绑定与接口映射(I50 2)

  1. compute_residual(model, data, params) -> r:确保 dim(r)=dim(y);必要时调用 check_dim。
  2. loss_rho(e, kind, hyper) -> float:传入无量纲 e 与超参数集合 {delta|c|nu}。
  3. psi_weight(e, kind, hyper) -> array:返回 w_psi(e);在异方差下外乘 1 / sigma^2。
  4. 典型调用序列:
    • r = compute_residual(...);s = s_MAD(r);e = r / s;
    • w = psi_weight(e, kind, hyper);W = diag( w / sigma^2 )(若给定 sigma);
    • 以 IRLS 更新 theta 与 s,迭代至收敛;
    • 计算 Cov_theta 与报告量 U(经《Core.Metrology》第5章管线)。

XI. 诊断与报告最小集合


XII. 本章输出与衔接


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/