目录文档-技术白皮书18-EFT.WP.Methods.CrossStats v1.0

第14章 质量指标、SLO 与审计(统计服务)


一句话目标:定义统计服务的 SLI/SLO 体系、度量与审计闭环,使估计、检验与决策在计量、时基与到达时两口径上可监控、可追溯、可回退。


I. 范围与对象

  1. 范围
    • 统计服务运行时质量治理:覆盖度、错误率、功效达成、漂移、时延、可复现性与合规审计。
    • 适用在线实验、离线评估、批/流混合管线。
  2. 对象
    • 输入:manifest.stats.*, trace, logs, metrics(stream),以及参考基线 ref。
    • 输出:audit_report, slo_attainment, violation_events, rollback_plan。
    • 时基:度量窗口在 tau_mono 上计算,对外以 ts 发布并附 offset/skew/J;涉及 T_arr 必记两口径与 delta_form。

II. 名词与变量


III. 公设 P314-*


IV. 最小方程 S314-*


V. 统计流程 M30-14(定义→埋点→计算→判定→审计→回退)


VI. 契约与断言 C30-14xx


VII. 实现绑定 I30-*

不变量:alpha_spent ≤ alpha_budget;metrics.window == Delta_t;sum(w_i)/N ≈ 1(若使用加权);signature 可验证。


VIII. 交叉引用


IX. 质量与风控

  1. SLI/SLO 面板建议
    • 基线:coverage_rate, ECE, FDR, latency_ms_p99, psi, alpha_spent, audit_completeness, decision_sign_stability。
    • 运行级:throughput, queue.rho, W_q, error_rate_ops。
  2. 回退策略
    • 轻度违约:提高窗口、触发再采样、自助法扩大区间。
    • 中度违约:冻结新发布,应用稳健口径(HK/贝叶斯更保守先验)。
    • 重度违约/安全阈:回滚到 ref 版本,强制再标定与再审计。
  3. 审计追溯
    以 TraceID 串联 manifest、代码版本与数据切片;校验 repro_hash 一致后归档。

小结

本章以 S314-* 度量和 C30-14xx 契约构成统计服务的质量闸门,并通过 M30-14 流程、I30-* 实现与跨卷时基/计量口径对齐,确保统计结论在准确性、及时性与可复现性上满足既定 SLO。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/