目录文档-技术白皮书(V5.05)18-EFT.WP.Methods.CrossStats v1.0

第14章 质量指标、SLO 与审计(统计服务)


一句话目标:定义统计服务的 SLI/SLO 体系、度量与审计闭环,使估计、检验与决策在计量、时基与到达时两口径上可监控、可追溯、可回退。


I. 范围与对象

  1. 范围
    • 统计服务运行时质量治理:覆盖度、错误率、功效达成、漂移、时延、可复现性与合规审计。
    • 适用在线实验、离线评估、批/流混合管线。
  2. 对象
    • 输入:manifest.stats.*, trace, logs, metrics(stream),以及参考基线 ref。
    • 输出:audit_report, slo_attainment, violation_events, rollback_plan。
    • 时基:度量窗口在 tau_mono 上计算,对外以 ts 发布并附 offset/skew/J;涉及 T_arr 必记两口径与 delta_form。

II. 名词与变量


III. 公设 P314-*


IV. 最小方程 S314-*


V. 统计流程 M30-14(定义→埋点→计算→判定→审计→回退)


VI. 契约与断言 C30-14xx


VII. 实现绑定 I30-*

不变量:alpha_spent ≤ alpha_budget;metrics.window == Delta_t;sum(w_i)/N ≈ 1(若使用加权);signature 可验证。


VIII. 交叉引用


IX. 质量与风控

  1. SLI/SLO 面板建议
    • 基线:coverage_rate, ECE, FDR, latency_ms_p99, psi, alpha_spent, audit_completeness, decision_sign_stability。
    • 运行级:throughput, queue.rho, W_q, error_rate_ops。
  2. 回退策略
    • 轻度违约:提高窗口、触发再采样、自助法扩大区间。
    • 中度违约:冻结新发布,应用稳健口径(HK/贝叶斯更保守先验)。
    • 重度违约/安全阈:回滚到 ref 版本,强制再标定与再审计。
  3. 审计追溯
    以 TraceID 串联 manifest、代码版本与数据切片;校验 repro_hash 一致后归档。

小结

本章以 S314-* 度量和 C30-14xx 契约构成统计服务的质量闸门,并通过 M30-14 流程、I30-* 实现与跨卷时基/计量口径对齐,确保统计结论在准确性、及时性与可复现性上满足既定 SLO。

版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05