53-模型卡 Template v1.0 | 第9章偏倚、伦理与安全 | 能量丝理论

第9章偏倚、伦理与安全

I. 目标与范围（Purpose & Scope）

规范模型的偏倚识别与缓解、伦理合规与安全防护的字段、流程与发布口径，覆盖数据/参数/训练/推理全链路，确保结果可审计、可追溯、最小化暴露。
凡涉及路径量（到达时/相位），正文显式 gamma(ell) 与测度 d ell，数据侧记录 delta_form ∈ {general, factored}；所有表达一律括号化，发布要求 p_dim = 1.0。

II. 前置条件与依赖（Prerequisites & Inputs）

数据与切分：对齐《数据集卡》Ch.3/Ch.4/Ch.6/Ch.7/Ch.9/Ch.11 的来源、Schema、Splits、QC、Bias/Ethics/Privacy 与 Bench 约定。
训练协议：对齐本卷第6章的 train_config.yaml、随机源固定与环境快照。
覆盖与协方差：对齐《误差预算卡》的 coverage ∈ {k, alpha, quantile} 与 Σ PD。
参数与新鲜度：对齐《参数注册卡》的 freshness.policy 与 cov_group。
引用与版本：一律“卷名 + 版本 + 锚点（P/S/M/I）”，锚点直指率 ≥ 90%，对外仅 v1.*。

III. 偏倚识别（Bias Identification）

抽样偏倚：来源/场地/时间窗/设备覆盖不均（分层计数与置信区间）；切片 slice_k 对比差异。
测量偏倚：δt_abs/Δτ_ch/σ_y(τ) 超阈或 n_eff 拟合系统性残差；记录至 quality.flags 与 bias_report.md。
标注偏倚：κ < κ_min、MAE > τ_mae、路径 DTW/Hausdorff 过大等一致性不足。
处理偏倚：清洗/归一化/增强对亚群体的非对称影响（以 slices 验证）。

IV. 偏倚缓解（Bias Mitigation）

再加权/重采样：分层权重或过/欠采样（固定 seed）；
口径修正：对测量偏差进行校准或扩大区间 U = k·u_c；
审校增强：提高 k_rep 与仲裁流程；
切片披露：高风险 slices 单列并在发布中标注 [Restricted] 或仅定性呈现。

V. 伦理合规（Ethics Compliance）

用途限制：purpose_limit、consent_id、retention_policy 与撤回机制；
最小化原则：仅保留必要字段；日志不落敏感原文；
透明与问责：在 docs/ethics.md 说明数据流、角色、审查与申诉路径；
第三方数据：核验许可/版权与再分发条件，清单中记录 license 与限制条款。

VI. 安全与滥用防护（Safety & Misuse Prevention）

风险场景：越权推断、群体歧视、恶意自动化、越界部署（超出相干窗/失锁/路径缺失）。
防护策略：
- 输入防护：Schema 校验、单位/量纲检查（I70-dim_check），路径块必备 gamma/measure/delta_form；
- 输出防护：阈值门与保守区间，越界则降级或 [Restricted]；
- 运行时：速率/配额、幂等键、黑/灰名单与熔断；
- 模型侧：不安全提示过滤、对抗/越权检测（如置信度门与漂移告警）。
事件与回退：异常触发 rollback_fsm.yaml，记录到 audit.jsonl。

VII. 路径量统一口径（Normative Path Forms）

到达时：
T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )；或 T_arr = ( ∫ ( n_eff / c_ref ) d ell )。
相位：
Phi = ( 2π / λ_ref ) * ( ∫ n_eff d ell )。

正文显式路径与测度；数据侧记录 delta_form；路径数组满足 len(gamma_ell)=len(d_ell)=len(n_eff)≥2。

VIII. 质量门映射（Gate Mapping）

G1 Schema 完整（Bias/Ethics/Safety 字段与文档就绪）；
G2 引用合规（锚点直指率 ≥ 90%）；
G3 路径规范（路径块齐备、步长合规）；
G4 量纲闭合（p_dim = 1.0，check_dim_report.json 通过）；
G5 新鲜度（clock_state="locked"，过期样本隔离）；
G6 覆盖一致（区间口径与误差卷一致）；
G7 协方差一致（高风险 slices 的统计假设与误差卷一致，Σ PD）；
G8 唯一性与无环（record_id/checksum 唯一，lineage DAG 无环）。
触发 S1–S5（量纲/新鲜度/路径/协方差/引用）即阻断发布或标注 [Restricted]。

IX. 机读策略与清单（Machine-Readable Policies）
A. safety_policy.yaml

version: "1.0.0"

inputs:

schema_check: true

unit_dim_check: true

path_required: { gamma: true, measure: true, delta_form: ["general","factored"] }

outputs:

confidence_guard: { min_conf: 0.6 }

restricted_label: "[Restricted]"

runtime:

rate_limit: { rps: 100, burst: 200 }

quota: { daily_calls: 100000 }

circuit_breaker: { error_ratio: 0.2, window_s: 60 }

B. bias_report.md（纲要）

# Bias Report

- Stratified coverage + CIs

- Measurement bias: δt_abs/Δτ_ch/σ_y(τ)/n_eff residuals

- Labeling consistency: κ/MAE/DTW

- High-risk slices & mitigation

C. ethics.md（纲要）

# Ethics Statement

- Purpose limitation & consent

- Minimization & de-identification

- Governance roles & escalation

- Third-party license & redistribution terms

X. 反例与修正（Anti-Patterns & Fixes）

反例：仅报均值无区间 → 修正：补充 k/alpha/quantile 区间与收敛诊断。
反例：T_arr = ∫ n_eff / c_ref d ell（缺括号） → 修正：使用括号化统一口径。
反例：未记录 consent_id/purpose_limit → 修正：补录并在清单与前言显著标注。
反例：路径块缺 d ell/delta_form → 修正：补齐并与 n_eff 等长。
反例：高风险切片未隔离 → 修正：单列并按 [Restricted] 发布或仅定性呈现。

XI. 交叉引用（Cross-References）

《数据集卡》：Ch.9（Bias/Ethics/Privacy）、Ch.6（Splits/Versioning）、Ch.7（QC）。
《误差预算卡》：Ch.8/Ch.9（区间与阈值映射）。
《管线卡》：Ch.9（监控与告警）、Ch.12（产出与发布）。
本卷：Ch.6（训练协议）、Ch.7（UQ）、Ch.8（Bench/Score）。

XII. 执行勾选清单（Checklist）

safety_policy.yaml、bias_report.md、ethics.md 就绪并在 model_manifest.yaml 中引用。
路径量显式 gamma/measure/delta_form；len(path) ≥ 2、Δell 合规；p_dim = 1.0。
偏倚指标与缓解方案完备；高风险 slices 的发布策略明确（定量/定性/[Restricted]）。
覆盖与协方差口径与误差卷一致；/validate 通过 G1–G8。
审计与合规材料入库，引用锚点直指率 ≥ 90%，所有制品具 checksum 与签名。