目录 / 文档-技术白皮书 / 53-模型卡 Template v1.0
I. 目标与范围(Purpose & Scope)
- 规范模型的偏倚识别与缓解、伦理合规与安全防护的字段、流程与发布口径,覆盖数据/参数/训练/推理全链路,确保结果可审计、可追溯、最小化暴露。
- 凡涉及路径量(到达时/相位),正文显式 gamma(ell) 与测度 d ell,数据侧记录 delta_form ∈ {general, factored};所有表达一律括号化,发布要求 p_dim = 1.0。
II. 前置条件与依赖(Prerequisites & Inputs)
- 数据与切分:对齐《数据集卡》Ch.3/Ch.4/Ch.6/Ch.7/Ch.9/Ch.11 的来源、Schema、Splits、QC、Bias/Ethics/Privacy 与 Bench 约定。
- 训练协议:对齐本卷第6章的 train_config.yaml、随机源固定与环境快照。
- 覆盖与协方差:对齐《误差预算卡》的 coverage ∈ {k, alpha, quantile} 与 Σ PD。
- 参数与新鲜度:对齐《参数注册卡》的 freshness.policy 与 cov_group。
- 引用与版本:一律“卷名 + 版本 + 锚点(P/S/M/I)”,锚点直指率 ≥ 90%,对外仅 v1.*。
III. 偏倚识别(Bias Identification)
- 抽样偏倚:来源/场地/时间窗/设备覆盖不均(分层计数与置信区间);切片 slice_k 对比差异。
- 测量偏倚:δt_abs/Δτ_ch/σ_y(τ) 超阈或 n_eff 拟合系统性残差;记录至 quality.flags 与 bias_report.md。
- 标注偏倚:κ < κ_min、MAE > τ_mae、路径 DTW/Hausdorff 过大等一致性不足。
- 处理偏倚:清洗/归一化/增强对亚群体的非对称影响(以 slices 验证)。
IV. 偏倚缓解(Bias Mitigation)
- 再加权/重采样:分层权重或过/欠采样(固定 seed);
- 口径修正:对测量偏差进行校准或扩大区间 U = k·u_c;
- 审校增强:提高 k_rep 与仲裁流程;
- 切片披露:高风险 slices 单列并在发布中标注 [Restricted] 或仅定性呈现。
V. 伦理合规(Ethics Compliance)
- 用途限制:purpose_limit、consent_id、retention_policy 与撤回机制;
- 最小化原则:仅保留必要字段;日志不落敏感原文;
- 透明与问责:在 docs/ethics.md 说明数据流、角色、审查与申诉路径;
- 第三方数据:核验许可/版权与再分发条件,清单中记录 license 与限制条款。
VI. 安全与滥用防护(Safety & Misuse Prevention)
- 风险场景:越权推断、群体歧视、恶意自动化、越界部署(超出相干窗/失锁/路径缺失)。
- 防护策略:
- 输入防护:Schema 校验、单位/量纲检查(I70-dim_check),路径块必备 gamma/measure/delta_form;
- 输出防护:阈值门与保守区间,越界则降级或 [Restricted];
- 运行时:速率/配额、幂等键、黑/灰名单与熔断;
- 模型侧:不安全提示过滤、对抗/越权检测(如置信度门与漂移告警)。
- 事件与回退:异常触发 rollback_fsm.yaml,记录到 audit.jsonl。
VII. 路径量统一口径(Normative Path Forms)
- 到达时:
T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell );或 T_arr = ( ∫ ( n_eff / c_ref ) d ell )。 - 相位:
Phi = ( 2π / λ_ref ) * ( ∫ n_eff d ell )。
正文显式路径与测度;数据侧记录 delta_form;路径数组满足 len(gamma_ell)=len(d_ell)=len(n_eff)≥2。
VIII. 质量门映射(Gate Mapping)
- G1 Schema 完整(Bias/Ethics/Safety 字段与文档就绪);
- G2 引用合规(锚点直指率 ≥ 90%);
- G3 路径规范(路径块齐备、步长合规);
- G4 量纲闭合(p_dim = 1.0,check_dim_report.json 通过);
- G5 新鲜度(clock_state="locked",过期样本隔离);
- G6 覆盖一致(区间口径与误差卷一致);
- G7 协方差一致(高风险 slices 的统计假设与误差卷一致,Σ PD);
- G8 唯一性与无环(record_id/checksum 唯一,lineage DAG 无环)。
- 触发 S1–S5(量纲/新鲜度/路径/协方差/引用)即阻断发布或标注 [Restricted]。
IX. 机读策略与清单(Machine-Readable Policies)
A. safety_policy.yaml
version: "1.0.0"
inputs:
schema_check: true
unit_dim_check: true
path_required: { gamma: true, measure: true, delta_form: ["general","factored"] }
outputs:
confidence_guard: { min_conf: 0.6 }
restricted_label: "[Restricted]"
runtime:
rate_limit: { rps: 100, burst: 200 }
quota: { daily_calls: 100000 }
circuit_breaker: { error_ratio: 0.2, window_s: 60 }
B. bias_report.md(纲要)
# Bias Report
- Stratified coverage + CIs
- Measurement bias: δt_abs/Δτ_ch/σ_y(τ)/n_eff residuals
- Labeling consistency: κ/MAE/DTW
- High-risk slices & mitigation
C. ethics.md(纲要)
# Ethics Statement
- Purpose limitation & consent
- Minimization & de-identification
- Governance roles & escalation
- Third-party license & redistribution terms
X. 反例与修正(Anti-Patterns & Fixes)
- 反例:仅报均值无区间 → 修正:补充 k/alpha/quantile 区间与收敛诊断。
- 反例:T_arr = ∫ n_eff / c_ref d ell(缺括号) → 修正:使用括号化统一口径。
- 反例:未记录 consent_id/purpose_limit → 修正:补录并在清单与前言显著标注。
- 反例:路径块缺 d ell/delta_form → 修正:补齐并与 n_eff 等长。
- 反例:高风险切片未隔离 → 修正:单列并按 [Restricted] 发布或仅定性呈现。
XI. 交叉引用(Cross-References)
- 《数据集卡》:Ch.9(Bias/Ethics/Privacy)、Ch.6(Splits/Versioning)、Ch.7(QC)。
- 《误差预算卡》:Ch.8/Ch.9(区间与阈值映射)。
- 《管线卡》:Ch.9(监控与告警)、Ch.12(产出与发布)。
- 本卷:Ch.6(训练协议)、Ch.7(UQ)、Ch.8(Bench/Score)。
XII. 执行勾选清单(Checklist)
- safety_policy.yaml、bias_report.md、ethics.md 就绪并在 model_manifest.yaml 中引用。
- 路径量显式 gamma/measure/delta_form;len(path) ≥ 2、Δell 合规;p_dim = 1.0。
- 偏倚指标与缓解方案完备;高风险 slices 的发布策略明确(定量/定性/[Restricted])。
- 覆盖与协方差口径与误差卷一致;/validate 通过 G1–G8。
- 审计与合规材料入库,引用锚点直指率 ≥ 90%,所有制品具 checksum 与签名。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/