目录文档-技术白皮书18-EFT.WP.Methods.CrossStats v1.0

附录D 指标与漂移度量(统计专属)


一句话目标:统一统计指标与漂移度量的定义、窗口化口径与阈值建议,并与契约库 C30-* 及 manifest.stats 字段一一映射,支撑稳定运行、合规与回退。


I. 范围与对象


II. 名词与变量


III. 公设 P30D-*


IV. 最小方程 S30D-*(基础与任务指标)


V. 漂移度量族 S30D-Drift-*


VI. 窗口化、基线与阈值

  1. 窗口定义:Window_k = [ tau_k, tau_k + Delta_t ),滑动步长 step ≤ Delta_t。
  2. 基线构造:baseline = Q_{ref}( metric ; q_low, q_high );可使用 EWMA_t = lambda * m_t + (1 - lambda) * EWMA_{t-1}。
  3. 阈值建议(示例口径,对应 C30-37*)
    • W1 ≤ 0.08(warn),W1 ≤ 0.10(error)。
    • psi ≤ 0.10(warn),psi ≤ 0.25(error)。
    • ECE ≤ 0.03(warn),ECE ≤ 0.05(error)。
    • 连续 r_win ∈ {2,3} 次越界升级处置。
  4. 组合护栏:fail = ( any(metric > hard_cap) ) ∨ ( consecutive_breach ≥ r_win )。

VII. 多维与类别特征漂移口径


VIII. 权重与抽样对齐


IX. 契约与清单映射

  1. 指标→契约:
    • W1/KL/psi → C30-370/371/373。
    • ECE/Brier/NLL → C30-360/361/362(校准与对数损失)。
    • 覆盖度与区间宽度 → C30-342/343。
    • A/B 护栏(样本量、alpha 消耗、延迟)→ C30-381/383/382。
  2. 指标→清单:写入 manifest.stats.metrics.{drift,core,ab,causal};阈值与证据写入 contracts[*].evidence;窗口策略写入 actions[*]。

X. 实现绑定 I30-D-*(参考)


XI. 审计与可追溯


小结

本附录将任务指标与漂移度量统一为加权、窗口化与到达时一致的可审计口径,配套阈值与序贯策略,直接映射至 C30-* 契约与 manifest.stats 字段,支撑跨系统一致发布与稳定运行。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/