目录文档-技术白皮书06-EFT.WP.Core.DataSpec v1.0

第8章 质量度量与漂移


I. 范围与目标


II. 术语、符号与依赖


III. 公设(P68-*)


IV. 基础质量指标定义(S68-1)

  1. 完整性:
    comp(field) = ( sum_{i=1..N} m_i ) / N。
  2. 合法性(基于契约 tests):
    valid(field) = ( count( value_i 满足 tests ) ) / ( count( m_i=1 ) )。
  3. 一致性(跨字段或跨表约束):
    consistency = 1 - ( violations / checks ),其中 checks 为执行的约束总数。
  4. 时效性(基于延迟阈值 SLA):
    timely = ( count( ts_now - ts_i <= SLA ) ) / N。
  5. 数值精度(可选,存在参考或模型时):
    • MAE = ( 1 / N_obs ) * sum | y - y_ref |。
    • RMSE = sqrt( ( 1 / N_obs ) * sum ( y - y_ref )^2 )。
    • MAPE = ( 100 / N_obs ) * sum | ( y - y_ref ) / max( |y_ref|, epsilon ) |。
    • chi2 = r^T R r,其中 r = y - f(x; theta),R = diag(w)(见《Core.Errors》)。

V. 指标归一化与聚合(S68-2)

  1. 指标归一化到 [0,1]:
    • 正向指标(越大越好)保持原值或截断:s = clip(metric, 0, 1)。
    • 反向指标(越小越好)使用:s = 1 / ( 1 + metric / tau ),其中 tau 为容忍尺度。
  2. 复合质量分:
    q_score = ( sum_{i} w_i * s_i ) / ( sum_{i} w_i ),w_i ≥ 0 且显式记录到 manifest.weights。
  3. 域内与域间聚合:
    • 域内:按字段或表局部 q_score(field) → q_score(table)。
    • 域间:按消费关键路径权重或访问频度进行二次聚合得到 q_score(domain)。

VI. 漂移度量(S68-3)

  1. 直方图 KL:
    KL(p||q) = sum_i p_i * log( p_i / q_i ),使用拉普拉斯平滑 p_i' = (p_i + alpha) / (1 + alpha * |bins|)。
  2. Jensen-Shannon:
    JSD(p, q) = 0.5 * KL(p||m) + 0.5 * KL(q||m),m = 0.5 * (p + q),JSD ∈ [0, log 2]。
  3. Wasserstein-1(一维连续):
    W1(p, q) = ∫_0^1 | F_p^{-1}(u) - F_q^{-1}(u) | du,报告 W1 / IQR_ref 的无量纲版本。
  4. PSI(Population Stability Index,分类型或分箱):
    PSI = sum_i ( q_i - p_i ) * log( q_i / p_i )。
  5. 缺失率漂移:
    delta_miss(field) = comp_ref(field) - comp_new(field)。
  6. 临界值建议:
    • JSD_norm = JSD / log 2,阈值分层见第 VIII。
    • 数值字段优先 W1 / IQR_ref,分类型优先 PSI,概率分布优先 JSD。

VII. 窗口化与基线(S68-4)


VIII. 告警与门控

  1. 分层阈值(建议,可在 manifest.thresholds 覆盖):
    • q_score:< 0.95(Warn),< 0.90(Error)。
    • JSD_norm:> 0.10(Warn),> 0.25(Error)。
    • W1 / IQR_ref:> 0.15(Warn),> 0.35(Error)。
    • PSI:> 0.10(Warn),> 0.25(Error)。
    • delta_miss(field):< -0.02(Warn),< -0.05(Error)。
  2. 门控规则:
    进入冻结前,q_score >= q_min 且所有核心字段的漂移度量低于 Error 阈值;若出现 Warn,需人工批准或补充测试通过。
  3. 严重性映射:
    Warn → 继续观测与降级服务;Error → 阻断发布或自动回滚上一个 tag。

IX. 跨卷锚点专项:T_arr 的质量与漂移

  1. 双口径一致性:
    • T_arr_factored = ( 1 / c_ref ) * ( ∫_gamma n_eff d ell )。
    • T_arr_general = ( ∫_gamma ( n_eff / c_ref ) d ell )。
    • delta_form = | T_arr_factored - T_arr_general |,断言 delta_form <= tol_Tarr。
  2. 漂移维度:
    n_eff 分布的 JSD_norm 与 W1 / IQR_ref;路径长度 L_gamma = ( ∫_gamma 1 d ell ) 的分布漂移;CRS 变更必须为 major(见第7章)。
  3. 质量门控:
    若 delta_form 连续 k 个窗口超过 Warn,进入专项诊断;超过 Error,阻断发布。

X. 流程规范

  1. Mx-3 质量评估流程:
    • 构建窗口 [t0, t1],对 D 进行 stream_records。
    • 计算各字段 comp/valid/consistency/timely 与可用的数值精度指标。
    • 归一化并按权重聚合为 q_score;更新 manifest.metrics。
    • 与阈值比较并输出告警事件与建议处置。
  2. Mx-4 漂移评估流程:
    • 以 D_ref 为基线,统一分箱或分位点。
    • 计算 JSD/PSI/W1 与 delta_miss,形成 drift_report。
    • 对超阈字段回写“根因提示”:sampling_change、seasonality、schema_change。
    • 若含 T_arr,同步计算并记录 delta_form。

XI. 指标输出与清单


XII. 实现绑定(I60 6 对齐)


XIII. 数值稳定与工程注意事项


XIV. 输出与处置策略(执行摘要)

  1. 进入发布门控前必须提供:q_score、drift_report、阈值比对结果与处置建议。
  2. 处置字典:
    • 采集侧退避与重采样(时效性不足);
    • 合约修复与回填(合法性失败);
    • 分箱与索引重建(一致性或漂移异常);
    • 模型再训练与参数更新(数值精度或分布漂移显著);
    • 回滚到上一个稳定 tag(Error 级触发)。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/