目录文档-技术白皮书19-EFT.WP.Methods.SynthData v1.0

附录D 指标与漂移度量(合成专属)


I. 适用范围与目标


II. 名词与变量


III. 公设 P40D-*


IV. 最小方程 S40D-*


V. 指标清单与发布口径

  1. Tabular
    • 下游效用:utility_gap_auc, utility_gap_rmse;校准:ECE, Brier。
    • W1(数值特征,按列与加权合成)、MMD_RBF(所有数值特征经标准化)、psi(关键分箱特征)。
  2. Image
    FID, KID, covg(kNN 覆盖),可选 LPIPS;嵌入空间与预处理口径固定。
  3. Text
    MMD(句向量),W1(嵌入投影),type-token 覆盖,utility_gap(下游分类/检索)。
  4. Audio
    频谱域 MMD_RBF,感知嵌入 W1,任务效用(关键词检测/ASR WER 差)。
  5. Graph
    度分布 KL/psi,子图频率 MMD,同配性差 |r_syn - r_real|。
  6. Time/Events
    到达强度差 || lambda_syn - lambda_real ||_1,自相关差 | ACF_k |,W1(事件间隔),并发布 T_arr 两口径与 delta_form。
  7. 发布映射
    每项指标写入 metrics.*:name, value, u, unit, window, details(核、带宽、backbone、层、标准化口径)。

VI. 漂移检测与告警(窗口化)

  1. 流程
    • 选取参考窗口 ref = [t0, t1) 与当前窗口 cur = [t, t+Delta_t)(tau_mono)。
    • 计算度量向量 m_ref, m_cur,得到差异 d = m_cur - m_ref 或距离 dist(ref, cur)。
    • 以 psi/W1/MMD 为主度量,辅以任务 utility_gap,形成多指标判据 score = agg( z_scores )。
    • 应用阈值或序贯检验(GLR/EWMA/CUSUM),生成 alert ∈ {none, warn, block}。
  2. 聚合规则
    agg = median_of_means(z_i; groups) 或 L_infty(保守);在 details 声明。
  3. 契约示例
    C40D-psi: psi ≤ 0.1;C40D-W1: W1 ≤ 0.06;C40D-utility: utility_gap_auc ≥ -0.01。
  4. 回退策略
    warn:降权合成流或触发再校准;block:冻结发布,回滚至上个通过的 bundle。

VII. 窗口与时基对齐


VIII. 阈值与功效设定


IX. 实现绑定 I40-*(与度量相关)

不变量:n_eff ≥ n_eff_min;度量空间/核/嵌入版本固定;delta_form ≤ tol_Tarr;check_dim(expr)=pass。


X. 交叉引用


XI. 小结

本附录给出 W1/MMD/KL/PSI/FID/KID/covg/utility_gap/ECE 的统一口径、窗口化与告警流程、不确定度与阈值设定,并提供实现绑定与发布映射。落盘时将全部度量与其 u(·)、窗口与计算细节写入 manifest.synth.metrics.*,契约结果写入 contracts.*,确保跨版本和跨模态可追溯与可审计。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/