目录 / 文档-技术白皮书 / 44-EFT.WP.Data.ModelCards v1.0
I. 章节目的与范围
给出模型卡字段分层(必填/条件必填/可选)、命名与类型约束、最小正则与示例;所有键名采用 snake_case,数组用 [] 标示复数实体;跨卷引用采用“卷名 vX.Y:锚点”。II. 字段分层与命名约定
- 分层:
- 必填(Required):发布时必须存在,且通过类型/正则/依赖校验。
- 条件必填(Conditionally Required):满足触发条件时必须存在(见“触发条件”列)。
- 可选(Optional):存在即校验,不存在不报错。
- 命名与引用:键名一律 snake_case;引用字段在 see[] 使用 "卷名 vX.Y:锚点";导出物含 references[] 与 version。
III. 必填字段清单(Required)
键名 | 类型 | 约束/正则 | 语义定义 | 依赖与引用 |
|---|---|---|---|---|
model_id | string | ^[a-z0-9_\\-.]+$ | 模型唯一标识(对外发布与血缘引用根键) | 导出组织见 DataSpec。 |
title | string | 长度 ≥ 3 | 人类可读标题 | — |
version | string | ^v\\d+\\.\\d+(\\.\\d+)?$ | 语义化版本(对外仅用稳定线) | 引用规范 v0.1。 |
task | string | enum | 任务类型(如 classification/retrieval/generation/asr/timeseries 等) | 与评测协议一致。 |
io_schema | object | schema | 输入/输出模式(shape/dtype/约束) | 与部署接口一致。 |
architecture | object | schema | 架构与参数(backbone/模块/参数量) | — |
training_data | object | schema | 训练数据引用与冻结切分映射 | 回指 DatasetCards。 |
preprocess | object | schema | 训练/推理前处理流水线,参数锁定 | 与计量校核一致。 |
optimization | object | schema | 目标函数与优化器、调度器 | — |
hyperparams | object | schema | 关键超参数与搜索口径 | — |
evaluation | object | schema | 评测协议与指标、显著性 | 冻结切分;见质量章。 |
calibration | object | schema | 概率校准方法与覆盖指标 | 计量/不确定度一致。 |
robustness | object | schema | 偏移/对抗扰动与鲁棒性报告 | — |
fairness | object | schema | 公平性维度与差异阈值 | — |
safety | object | schema | 使用限制/危害防控/安全审计 | 与合规对接。 |
deployment | object | schema | 部署形态/设备/并发与时延 | — |
resources | object | schema | 资源用量(M_param/FLOPs/T_inf/QPS) | 单位由计量章统一。 |
export_manifest | object | schema | 导出清单,含 version、references[]、工件列表 | 机器可读引用。 |
IV. 条件必填字段清单(Conditionally Required)
键名 | 类型 | 触发条件 | 约束/正则 | 说明 | 依赖与引用 |
|---|---|---|---|---|---|
path_dependence | object | 涉及路径量(如 T_arr) | schema | 登记 delta_form、path="gamma(ell)"、measure="d ell" | Equations v1.1;Metrology v1.0。 |
privacy_preserving | object | 涉及 DP/安全推理 | schema | dp_epsilon、推理加密口径 | 合规/隐私对接。 |
compression | object | 蒸馏/剪枝/量化 | schema | 方法与精度影响 | 质量/评测一致。 |
explainability | object | 提供可解释性 | schema | 方法(Grad/IG/LRP…)与覆盖率 | — |
V. 可选扩展字段清单(Optional)
键名 | 类型 | 约束 | 说明 |
|---|---|---|---|
audit_trails | object | 工件可追溯 | 审计日志、DAG、报告链接键 |
license_constraints | object | enum/policy | 许可约束与地域限制 |
notes | string | — | 备注(非规范性) |
VI. task 与 io_schema 片段(规范性)
task: "classification" # classification|retrieval|generation|asr|segmentation|timeseries|...
io_schema:
inputs:
- {name:"image", shape:"(H,W,3)", dtype:"uint8", range:"[0,255]"}
outputs:
- {name:"probs", shape:"(K,)", dtype:"float32", range:"[0,1]", semantics:"softmax"}
batching: {mode:"static|dynamic", max_batch: 64}
streaming: {enabled:false}
(I/O 模式与部署接口、评测协议保持一致;单位/量纲遵循计量章。)
VII. 训练数据绑定与冻结切分(节选)
training_data:
refs:
- "EFT.WP.Data.DatasetCards v1.0:Ch.11" # splits & distribution
- "EFT.WP.Data.DatasetCards v1.0:Ch.12" # quality & baselines
splits_ref: "eift.obs.demo@v1.0" # 冻结切分引用
contamination_policy: "forbid-cross-split"
(模型卡引用数据事实,禁止复制;引用携带版本与锚点。)
VIII. 评测与校准(节选)
evaluation:
protocol: {splits:"frozen", seeds:[0,1,2,3,4], repeats:5,
significance:{test:"permutation", alpha:0.05}}
metrics: [{name:"f1_macro"}, {name:"roc_auc"}, {name:"ece"}, {name:"brier"}]
calibration:
method: "temperature"
params: {t: 1.7}
report: {ece: 0.018, brier: 0.072}
(显著性与覆盖指标与质量/计量章一致。)
IX. 导出清单与引用(export_manifest 片段)
export_manifest:
version: "v1.0"
artifacts:
- {path:"model_card.yaml", sha256:"..."}
- {path:"eval/summary.csv", sha256:"..."}
references:
- "EFT.WP.Core.DataSpec v1.0:EXPORT"
- "EFT.WP.Core.Metrology v1.0:check_dim"
- "EFT.WP.Core.Equations v1.1:S20-1"
(导出物必须含 version 与 references[],引用携带卷名+版本+锚点。)
X. 键模式与最小正则
- 标识与版本:model_id: ^[a-z0-9_\\-.]+$;version: ^v\\d+\\.\\d+(\\.\\d+)?$。
- 引用锚点:references[*]: ^[^:]+ v\\d+\\.\\d+:[A-Z].+$。
- 量纲校核:metrology.units="SI" 且 check_dim=true。
XI. see[] 与跨卷依赖映射(示例)
see:
- "EFT.WP.Data.DatasetCards v1.0:Ch.11"
- "EFT.WP.Core.Metrology v1.0:check_dim"
- "EFT.WP.Core.Equations v1.1:S20-1"
(按固定格式与 P/S/M/I 锚点类型进行条文级引用优先。)
XII. 本章合规自检
- 所有必填键存在且通过类型/正则校验;保留名未被重定义。
- export_manifest 含 version 与 references[];see[] 使用 "卷名 vX.Y:锚点"。
- 涉及 T_arr 的条目已登记 delta_form、path、measure,并通过 check_dim。
- 符号/公式遵循反引号与括号规则,不使用中文;T_fil/T_trans、n/n_eff 不混用。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/