目录文档-技术白皮书(V5.05)18-EFT.WP.Methods.CrossStats v1.0

附录D 指标与漂移度量(统计专属)


一句话目标:统一统计指标与漂移度量的定义、窗口化口径与阈值建议,并与契约库 C30-* 及 manifest.stats 字段一一映射,支撑稳定运行、合规与回退。


I. 范围与对象


II. 名词与变量


III. 公设 P30D-*


IV. 最小方程 S30D-*(基础与任务指标)


V. 漂移度量族 S30D-Drift-*


VI. 窗口化、基线与阈值

  1. 窗口定义:Window_k = [ tau_k, tau_k + Delta_t ),滑动步长 step ≤ Delta_t。
  2. 基线构造:baseline = Q_{ref}( metric ; q_low, q_high );可使用 EWMA_t = lambda * m_t + (1 - lambda) * EWMA_{t-1}。
  3. 阈值建议(示例口径,对应 C30-37*)
    • W1 ≤ 0.08(warn),W1 ≤ 0.10(error)。
    • psi ≤ 0.10(warn),psi ≤ 0.25(error)。
    • ECE ≤ 0.03(warn),ECE ≤ 0.05(error)。
    • 连续 r_win ∈ {2,3} 次越界升级处置。
  4. 组合护栏:fail = ( any(metric > hard_cap) ) ∨ ( consecutive_breach ≥ r_win )。

VII. 多维与类别特征漂移口径


VIII. 权重与抽样对齐


IX. 契约与清单映射

  1. 指标→契约:
    • W1/KL/psi → C30-370/371/373。
    • ECE/Brier/NLL → C30-360/361/362(校准与对数损失)。
    • 覆盖度与区间宽度 → C30-342/343。
    • A/B 护栏(样本量、alpha 消耗、延迟)→ C30-381/383/382。
  2. 指标→清单:写入 manifest.stats.metrics.{drift,core,ab,causal};阈值与证据写入 contracts[*].evidence;窗口策略写入 actions[*]。

X. 实现绑定 I30-D-*(参考)


XI. 审计与可追溯


小结

本附录将任务指标与漂移度量统一为加权、窗口化与到达时一致的可审计口径,配套阈值与序贯策略,直接映射至 C30-* 契约与 manifest.stats 字段,支撑跨系统一致发布与稳定运行。

版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05