目录文档-技术白皮书05-EFT.WP.Core.Errors v1.0

附录B 稳健损失与权函数速查


I. 使用口径与记号

  1. 残差定义:r def= y - f(x; theta);逐点残差 e_i def= r_i。
  2. 规模与标准化:s 为 robust scale,默认 s approx 1.4826 * MAD(r);标准化残差 t_i def= e_i / s。
  3. 权重矩阵与加权准则:R = diag(w_i),chi2 = r^T R r = sum_i w_i * e_i^2。
  4. 稳健目标:min_theta sum_i rho( t_i ; hyper );影响函数 psi(t) = d rho / d t;权函数 w(t) = psi(t) / t(当 t != 0,t = 0 取极限)。
  5. IRLS 更新骨架(与 I50-2 对应)
    • 计算 t_i = e_i / s;按所选损失得到 w_i = w(t_i; hyper)。
    • 以 R = diag(w_i) 解加权最小二乘更新 theta。
    • 若启用自适应规模,重估 s,如 s_new = 1.4826 * MAD( r_new );至收敛。

II. 常用损失族(rho / psi / w)速查

  1. 约定:均以 t = e / s 表示标准化残差;c > 0 为调谐常数(如 Huber、Tukey、Cauchy、Fair、Geman-McClure、Andrews);nu > 0 为 StudentT(nu) 自由度。
  2. 输出接口对齐:loss_rho(kind, hyper) 与 psi_weight(kind, hyper),其中 hyper 至少包含 {"c":..., "nu":...} 中的相关键。
  3. L2(Quadratic)
    • rho(t) = 0.5 * t^2
    • psi(t) = t
    • w(t) = 1
    • 特性:高效率,抗离群性弱,不降权。
  4. L1(Absolute)
    • rho(t) = |t|
    • psi(t) = sign(t)(t = 0 未定义,取 0)
    • w(t) = 1 / |t|(数值实现需 max(|t|, eps))
    • 特性:对尖峰稳健,解多为稀疏残差;对小噪声不如 L2 高效。
  5. Huber(c)
    • rho(t) = 0.5 * t^2 若 |t| <= c;否则 rho(t) = c * ( |t| - 0.5 * c )
    • psi(t) = t 若 |t| <= c;否则 psi(t) = c * sign(t)
    • w(t) = 1 若 |t| <= c;否则 w(t) = c / |t|
    • 特性:过渡型,兼顾效率与稳健;常用 c ~ 1.345(正态下约 95% 效率)。
  6. Tukey(Bisquare,c)
    • rho(t) = (c^2 / 6) * ( 1 - ( 1 - (t^2 / c^2) )^3 ) 若 |t| <= c;否则 rho(t) = c^2 / 6
    • psi(t) = t * ( 1 - (t^2 / c^2) )^2 若 |t| <= c;否则 psi(t) = 0
    • w(t) = ( 1 - (t^2 / c^2) )^2 若 |t| <= c;否则 w(t) = 0
    • 特性:redescending,强力抑制离群;常用 c ~ 4.685(正态 95% 效率)。
  7. Cauchy(c)
    • rho(t) = (c^2 / 2) * ln( 1 + (t^2 / c^2) )
    • psi(t) = t / ( 1 + (t^2 / c^2) )
    • w(t) = 1 / ( 1 + (t^2 / c^2) )
    • 特性:重尾,软降权,平滑可导。
  8. StudentT(nu)
    • rho(t) = 0.5 * (nu + 1) * ln( 1 + t^2 / nu )
    • psi(t) = ( (nu + 1) * t ) / ( nu + t^2 )
    • w(t) = (nu + 1) / ( nu + t^2 )
    • 特性:由 nu 控制尾厚;nu 小更稳健,nu -> ∞ 近似 L2。
  9. Fair(c)
    • rho(t) = c^2 * ( |t|/c - ln( 1 + |t|/c ) )
    • psi(t) = t / ( 1 + |t|/c )
    • w(t) = 1 / ( 1 + |t|/c )
    • 特性:平滑过渡,较 Huber 更柔和的降权。
  10. Geman-McClure(c)
    • rho(t) = 0.5 * ( t^2 / ( 1 + t^2 / c^2 ) )
    • psi(t) = t / ( 1 + t^2 / c^2 )^2
    • w(t) = 1 / ( 1 + t^2 / c^2 )^2
    • 特性:redescending,强抑制大离群;对初值敏感。
  11. Andrews(Sine,c)
    • rho(t) = (c^2 / 2) * ( 1 - cos( t / c ) ) 若 |t| <= pi * c;否则 rho(t) = c^2 / 2
    • psi(t) = sin( t / c ) 若 |t| <= pi * c;否则 psi(t) = 0
    • w(t) = sin( t / c ) / ( t / c ) 若 |t| <= pi * c;否则 w(t) = 0
    • 特性:redescending,光滑但在 pi c 处截断。

III. 参数与规模的选择

  1. 规模估计 s
    • 基线:s0 = 1.4826 * MAD(r);迭代时可采用 s_new = 1.4826 * MAD( r_new ) 或基于 chi2/dof 校正。
    • 当存在显著的加权或缺失:以掩码 m ∈ {0,1} 与权 w 共同修正 MAD。
  2. 典型调谐常数(正态 95% 效率参考)
    • Huber: c ~ 1.345;Tukey: c ~ 4.685;Cauchy: c ~ 2.385;Fair: c ~ 1.399。
    • StudentT: nu in [3, 8] 常用;nu = 4 具备更强尾部稳健性。
  3. 选型建议
    • 少量中等离群:Huber。
    • 明显重尾或强离群:Tukey / Cauchy / StudentT(nu<=5)。
    • 需要平滑导数并兼顾鲁棒:Cauchy / Fair。
    • 离群可能大量且远离:Tukey / Geman-McClure / Andrews(注意初始化)。

IV. IRLS 实施细节(与 I50-2 一致)


V. 与误差传播、异常筛除的衔接


VI. 到达时误差 T_arr 的稳健口径(跨卷锚点)

  1. 观测模型:r_T def= T_meas - ( ∫_gamma ( n_eff / c_ref ) d ell )。
  2. 稳健拟合:以 rho_T( r_T / s ; hyper ) 作为每次到达的损失,权重 w_T = w( r_T / s ) 进入 R。
  3. 双口径一致性检查:
    • 常量外提:T_arr = ( 1 / c_ref ) * ( ∫_gamma n_eff d ell )
    • 一般口径:T_arr = ( ∫_gamma ( n_eff / c_ref ) d ell )
    • 报告中记录 delta = |T_arr(form-1) - T_arr(form-2)|;若 delta 超出阈值,则触发 E.T_ARR.CONSISTENCY.DUAL_FORM_MISMATCH 并建议 enforce_arrival_time_convention()。

VII. 快速对照清单(实现与选型)


VIII. 报告与复现字段(与附录A 对齐)


IX. 数值与实现注意事项


X. 与 I50- 的最小落地范式*


XI. 参考选择流程(简版决策树)


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/