目录 / 文档-技术白皮书 / 44-EFT.WP.Data.ModelCards v1.0
I. 章节目的与范围
,涵盖分布偏移与失效模式、对抗性评测设置与阈值、线上稳健性与回放一致性、指标与报告格式;并确保与《任务与 I/O》《训练数据与采样绑定》《预处理与特征工程》《评测协议与指标》《校准与不确定度》及计量章一致。规范性定义固化模型卡中 robustness 的II. 字段与结构(规范性)
robustness:
shift_tests: # 合成偏移/扰动
- {name:"snr_drop", severity:[3,6,9], policy:"additive-noise"}
- {name:"time_jitter", ms:[5,10,20], policy:"shuffle-window"}
- {name:"spec_notch", bands:[["0.3","0.5"],["0.6","0.7"]], unit:"fraction"}
natural_shifts: # 自然域偏移(设备/地域/季节/域)
axes: ["device","region","season"]
splits: ["val","test"]
adversarial: # 对抗性评测(如启用)
enabled: false
threat_model: "whitebox|blackbox|transfer"
norm: "Linf|L2|L1"
epsilon: 0.01
steps: 10
restarts: 1
targeted: false
metrics: # 稳健性指标
primary: ["Δ_rel","acc_robust","auc_robust"]
curves: ["acc-vs-ε","acc-vs-SNR","acc-vs-mask"]
thresholds: # 阈值(阻断/预警)
drop_rel_max: 0.10 # 最大允许相对降幅
acc_robust_min: 0.80 # 指定偏移下的最小稳健准确率
ece_max_under_shift: 0.05 # 偏移下校准漂移上限
online_consistency: # 线上一致性(shadow/canary)
shadow_mode: true
window: "7d"
drift_monitors: ["drift_kl","psi"]
alert_rules:
- {name:"robust_drop", rule:"Δ_rel>0.10 for 60m", severity:"high"}
reporting:
table_axes: ["shift","severity","metric"]
include_ci: true # 指标配 95% 置信区间
significance: {test:"bootstrap", alpha:0.05}
notes?: "<non-normative>"
III. 合成偏移(定义与控制)
- snr_drop:以 dB 指定信噪比级别的加性噪声;说明噪声类型(高斯/有色)、随机种子策略,以及施加在归一化前/后。
- time_jitter:时间抖动/重排;给出毫秒级窗口与边界处理方式。
- spec_notch:频带挖空;明确归一化频带范围、掩膜取值(零/中位数)以及是否连续或按样本随机。
IV. 自然域偏移(In-the-Wild)
- 列举轴(如设备型号、地理区域、季节、域)。
- 报告每一轴的覆盖与样本数;与数据集卡 coverage 的映射保持一致。
- 各轴分别给出分层指标与置信区间;超出公平性阈值(见第11章)时须标注与处置。
V. 对抗性评测(如启用)
- 威胁模型:whitebox(如 PGD)、blackbox(基于分数/决策)或 transfer。
- 范数与幅度:执行 ‖δ‖_p ≤ ε;列出步数/重启次数及是否 targeted。
- 安全护栏:生产环境否名单不安全变换;对抗测试默认离线,除非显式以 canary 方式上线。
VI. 指标与阈值
- 相对降幅:Δ_rel = ( baseline - under_shift ) / max( baseline, ε )。
- 稳健准确率:指定偏移条件下的 acc_robust,或在一组偏移上的最坏值。
- 面积指标:auc_robust(跨 ε/SNR/掩膜跨度的曲线下面积)。
- 偏移下校准:报告 ECE/Brier;确保不超过 ece_max_under_shift。
- 阻断策略:若 Δ_rel > drop_rel_max、acc_robust < acc_robust_min 或校准超上限,视为发布阻断。
VII. 线上稳健性与回放一致性
- Shadow/Canary:在设定 window 内执行影子推理并监控漂移;持续越阈按 alert_rules 告警。
- 回放:对脱敏日志进行回放,离线/线上趋势需在容忍度内一致;超阈需给出偏差成因分析。
VIII. 计量与单位
- 对时间/频率/能耗/性能等指标声明单位并通过 check_dim 校核。
- 当稳健性涉及路径依赖量时,登记 delta_form、路径 gamma(ell) 与测度 d ell;T_arr 使用以下两种等价式之一:
- T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )
- T_arr = ( ∫ ( n_eff / c_ref ) d ell )。
IX. 机器可读片段(可直接嵌入)
robustness:
shift_tests:
- {name:"snr_drop", severity:[3,6,9], policy:"additive-noise"}
- {name:"time_jitter", ms:[5,10,20], policy:"shuffle-window"}
- {name:"spec_notch", bands:[["0.3","0.5"],["0.6","0.7"]], unit:"fraction"}
natural_shifts: {axes:["device","region"], splits:["val","test"]}
adversarial: {enabled:false, threat_model:"whitebox", norm:"Linf", epsilon:0.01, steps:10, restarts:1, targeted:false}
metrics: {primary:["Δ_rel","acc_robust"], curves:["acc-vs-ε","acc-vs-SNR"]}
thresholds: {drop_rel_max:0.10, acc_robust_min:0.80, ece_max_under_shift:0.05}
online_consistency:
shadow_mode: true
window: "7d"
drift_monitors: ["drift_kl","psi"]
alert_rules: [{name:"robust_drop", rule:"Δ_rel>0.10 for 60m", severity:"high"}]
reporting: {table_axes:["shift","severity","metric"], include_ci:true, significance:{test:"bootstrap", alpha:0.05}}
X. 导出清单与审计轨
export_manifest:
artifacts:
- {path:"robustness/summary.csv", sha256:"..."}
- {path:"robustness/acc_vs_eps.csv", sha256:"..."}
- {path:"robustness/acc_vs_snr.csv", sha256:"..."}
- {path:"robustness/calibration_under_shift.csv", sha256:"..."}
- {path:"robustness/alert_rules.yaml", sha256:"..."}
references:
- "EFT.WP.Core.DataSpec v1.0:EXPORT"
- "EFT.WP.Core.Metrology v1.0:check_dim"
可校验且与模型卡字段一致。必须稳健性表格/曲线与告警配置XI. 本章合规自检
- 合成与自然偏移的参数清晰可复现;指标配 95% 置信区间与显著性检验。
- 阻断阈值(drop_rel_max、acc_robust_min、ece_max_under_shift)已设定并达标;若启用对抗评测,已明确范数/ε/步数/重启。
- 时间/频率/性能等单位通过 check_dim;涉及路径量时登记 delta_form/path/measure。
- 影子/金丝雀策略与回放一致性已记录;漂移告警已配置。
- 导出清单列出稳健性工件及 sha256;引用采用“卷名 vX.Y:锚点”。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/