目录 / 文档-技术白皮书 / 16-EFT.WP.Methods.Cleaning v1.0
一句话目标:以可度量的 SLI、可承诺的 SLO 与可追溯的审计链,形成“评分→闸门→发布/回退”的闭环质量治理。
I. 范围与对象
- 对象与输入输出
- 输入:清洗后数据集 ds'、过程度量 TS.sli.*、断言报告 assert_report、不确定度 u(x)、清单 manifest.*、版本与标签 tag、追溯标识 TraceID。
- 输出:质量评分 q_score、SLO 评估结果 slo_ok、错误预算 EB 与燃尽率 burn、审计记录 audit.log、回退/冻结决策与签名。
- 适用边界
离线批处理与流式执行图 G=(V,E) 一致;所有统计在 tau_mono 窗口 Delta_t 内评估,于 ts 发布。
II. 名词与变量
- 质量评分与子项
- q_score ∈ [0,1],由子评分向量 s = { s_cover, s_integrity, s_timeliness, s_consistency, s_contract } 与权重 w = { w_i } 聚合得到。
- clip(z,a,b) 将 z 截断到 [a,b]。
- SLI 与 SLO
- SLI:TS.sli.lat_ms(端到端延迟)、TS.sli.err_rate(失败率)、TS.sli.fresh_age(数据时效)、TS.sli.miss_ratio(缺失占比)、TS.sli.delta_form(两口径差)、TS.sli.drift(漂移度)。
- 分位:P99(x) = inf { z : F_x(z) ≥ 0.99 },P95(x) 同理。
- SLO 判据:SLO = ( P( metric ≤ target ) ≥ 1 - alpha ) 或 Px(metric) ≤ target。
- 错误预算与燃尽
- 周期预算:EB_total = alpha * N_req(以请求或窗口为单位)。
- 已消耗:EB_used = ∑ breach_events;剩余:EB = EB_total - EB_used。
- 燃尽率:burn = ( EB_used / EB_total ) / ( t / T_budget )。
- 审计与签名
记录哈希链:h_k = hash_sha256( h_{k-1} || record_k ),h_0 为种子;每条含 ts, actor, action, object, delta, result, signature, TraceID。
III. 公设(P114-*)
- P114-01 度量显式公设
所有质量度量必须以命名 SLI 出现,并标注窗口 Delta_t、测度与取样策略。 - P114-02 单位与量纲一致公设
质量度量的单位/量纲与目标同域可比,check_dim( metric - target ) = 0(见第4章)。 - P114-03 分位稳健公设
用 P95/P99 代替均值作为 SLO 指标,异常截尾与缺失以 m ∈ {0,1}、q_score 降权参与。 - P114-04 审计可追溯公设
任何影响发布的决策均形成哈希链与签名链,满足“改动可见、回退可证”。 - P114-05 错误预算治理公设
以错误预算 EB 为单一治理变量,燃尽超阈触发降级、限流与回退(与第11章背压协同)。
IV. 最小方程(S114-*)
- S114-01 质量评分聚合
加权几何式(惩罚短板):
q_score = clip( exp( ( ∑_i w_i * ln( max( s_i, eps ) ) ) / ( ∑_i w_i ) ), 0, 1 )。
备选线性式:q_score = clip( ( ∑_i w_i * s_i ) / ( ∑_i w_i ), 0, 1 )。 - S114-02 子评分映射(小于为优)
给定度量 x 与门限 t、斜率 k:
s(x; t, k) = 1 / ( 1 + exp( k * ( x - t ) ) )。
“区间最优”用分段或双阈映射。 - S114-03 SLO 判定(分位式)
slo_ok(metric) = [ P99(metric) ≤ target ];
失败事件计数:breach = 1( P99(metric) > target )。 - S114-04 错误预算燃尽
burn = ( EB_used / EB_total ) / ( t / T_budget ),告警门 burn ≥ burn_hi;
失效门:EB ≤ 0 触发强制回退。 - S114-05 审计哈希链
h_k = hash_sha256( h_{k-1} || record_k ),校验条件:verify(signature, record_k)。
V. 清洗流程(M10-14 评分—SLO—审计)
- 采集与标准化 SLI
生成 TS.sli.*,统一单位与量纲;为每项设 Delta_t, sampling, unit。 - 子评分映射
用 S114-02 将 TS.sli.* 映射为 s_* ∈ [0,1],缺失用 m, q_score 加权或降权。 - 聚合与阈值校核
以 S114-01 聚合得到 q_score;并计算关键分位 P95/P99。 - SLO 判定与错误预算
以 S114-03 判断 slo_ok;更新 EB_used, EB 与 burn(S114-04)。 - 决策与执行
- 若 slo_ok ∧ EB > 0 ∧ assert_report.pass,进入冻结候选;
- 若 burn ≥ burn_hi 或 EB ≤ 0,执行降级/限流与回退(见第11章);
- 配置灰度发布按 q_score 与 EB 控流。
- 审计与签名
写入 audit.log,更新 h_k,签名并与 manifest 互引;导出 quality_panel。 - 落盘与发布
符合闸门则 freeze_release(ds', tag);否则隔离并给出修复单 change_ref。
VI. 契约与断言
- 评分与分位
- q_score ≥ q_min;P99(TS.sli.lat_ms) ≤ L_target;P99(TS.sli.err_rate) ≤ E_target;
- P95(TS.sli.fresh_age) ≤ A_target;P99(TS.sli.delta_form) ≤ tol_Tarr。
- 错误预算
EB ≥ 0;burn ≤ burn_hi;连续 B 个窗口 burn > burn_mid 触发降级。 - 审计与追溯
verify_chain( audit.log ) = true;manifest.signature 可验证;TraceID 全链一致。 - 合规联动
assert_contract.pass = true(见第10章);量纲断言与到达时两口径断言必须为真(见第4章、第6章)。
VII. 实现绑定(I10-14)
- compute_sli(ds', policy, window) -> TS.sli.*
生成标准化 SLI,含窗口与采样元数据。 - score_quality(TS.sli.*, weights, maps) -> s_*, q_score
应用映射与聚合,输出子评分与总分。 - assert_slo(TS.sli.*, targets, alpha) -> slo_ok, breaches
计算分位并判定 SLO,返回失败事件。 - update_error_budget(breaches, N_req, alpha, t, T_budget) -> EB, burn
维护错误预算与燃尽率。 - emit_audit(record) -> h_k
追加审计记录并返回最新哈希链头。 - rollback_release(tag, reason) -> status
触发回退并写审计;与第10章冻结接口互通。 - publish_quality_panel(q_score, TS.sli.*, EB, burn) -> panel
产出质量面板与可视化数据。
VIII. 交叉引用
- 契约与发布冻结:见本卷第10章。
- 时间窗口与分位评估:见本卷第5章。
- 两口径与 delta_form:见本卷第6章。
- 异常与漂移联动:见本卷第8章。
- 密度与归一化质量:见本卷第13章。
- 模式与追溯字段:见《EFT.WP.Core.DataSpec v1.0》。
IX. 质量度量与风控
- 核心面板
- q_score, P99(TS.sli.lat_ms), P99(TS.sli.err_rate), P95(TS.sli.fresh_age), P99(TS.sli.delta_form), EB, burn, viol_rate。
- 分布监控:hist(lat_ms), cdf(err_rate);窗口一致性:|metric_stream - metric_batch|。
- 风控策略
- burn ≥ burn_hi:立即降级与限流,开启只读发布。
- P99(lat_ms) 连续超阈:扩大缓冲或调度优先级(见第11章)。
- P99(delta_form) 超阈:触发到达时重算与环境修正(见第12章)。
- 审计链异常:冻结发布并强制复核签名与 TraceID。
小结
本章以标准化 SLI、形式化 SLO 与错误预算为核心,给出 q_score 聚合与闸门判据,辅以哈希链审计与回退机制,构成“度量—承诺—追溯”的质量闭环。产出物包含 quality_panel, audit.log, EB/burn,并通过 manifest.signature, TraceID 实现端到端可证合规。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/