目录文档-技术白皮书44-EFT.WP.Data.ModelCards v1.0

第3章 字段总览


I. 章节目的与范围

给出模型卡字段分层(必填/条件必填/可选)、命名与类型约束、最小正则与示例;所有键名采用 snake_case,数组用 [] 标示复数实体;跨卷引用采用“卷名 vX.Y:锚点”。

II. 字段分层与命名约定

  1. 分层
    • 必填(Required):发布时必须存在,且通过类型/正则/依赖校验。
    • 条件必填(Conditionally Required):满足触发条件时必须存在(见“触发条件”列)。
    • 可选(Optional):存在即校验,不存在不报错。
  2. 命名与引用:键名一律 snake_case;引用字段在 see[] 使用 "卷名 vX.Y:锚点";导出物含 references[] 与 version。

III. 必填字段清单(Required)

键名

类型

约束/正则

语义定义

依赖与引用

model_id

string

^[a-z0-9_\\-.]+$

模型唯一标识(对外发布与血缘引用根键)

导出组织见 DataSpec。

title

string

长度 ≥ 3

人类可读标题

version

string

^v\\d+\\.\\d+(\\.\\d+)?$

语义化版本(对外仅用稳定线)

引用规范 v0.1。

task

string

enum

任务类型(如 classification/retrieval/generation/asr/timeseries 等)

与评测协议一致。

io_schema

object

schema

输入/输出模式(shape/dtype/约束)

与部署接口一致。

architecture

object

schema

架构与参数(backbone/模块/参数量)

training_data

object

schema

训练数据引用与冻结切分映射

回指 DatasetCards。

preprocess

object

schema

训练/推理前处理流水线,参数锁定

与计量校核一致。

optimization

object

schema

目标函数与优化器、调度器

hyperparams

object

schema

关键超参数与搜索口径

evaluation

object

schema

评测协议与指标、显著性

冻结切分;见质量章。

calibration

object

schema

概率校准方法与覆盖指标

计量/不确定度一致。

robustness

object

schema

偏移/对抗扰动与鲁棒性报告

fairness

object

schema

公平性维度与差异阈值

safety

object

schema

使用限制/危害防控/安全审计

与合规对接。

deployment

object

schema

部署形态/设备/并发与时延

resources

object

schema

资源用量(M_param/FLOPs/T_inf/QPS)

单位由计量章统一。

export_manifest

object

schema

导出清单,含 version、references[]、工件列表

机器可读引用。


IV. 条件必填字段清单(Conditionally Required)

键名

类型

触发条件

约束/正则

说明

依赖与引用

path_dependence

object

涉及路径量(如 T_arr)

schema

登记 delta_form、path="gamma(ell)"、measure="d ell"

Equations v1.1;Metrology v1.0。

privacy_preserving

object

涉及 DP/安全推理

schema

dp_epsilon、推理加密口径

合规/隐私对接。

compression

object

蒸馏/剪枝/量化

schema

方法与精度影响

质量/评测一致。

explainability

object

提供可解释性

schema

方法(Grad/IG/LRP…)与覆盖率


V. 可选扩展字段清单(Optional)

键名

类型

约束

说明

audit_trails

object

工件可追溯

审计日志、DAG、报告链接键

license_constraints

object

enum/policy

许可约束与地域限制

notes

string

备注(非规范性)


VI. task 与 io_schema 片段(规范性)

task: "classification" # classification|retrieval|generation|asr|segmentation|timeseries|...

io_schema:

inputs:

- {name:"image", shape:"(H,W,3)", dtype:"uint8", range:"[0,255]"}

outputs:

- {name:"probs", shape:"(K,)", dtype:"float32", range:"[0,1]", semantics:"softmax"}

batching: {mode:"static|dynamic", max_batch: 64}

streaming: {enabled:false}

(I/O 模式与部署接口、评测协议保持一致;单位/量纲遵循计量章。)


VII. 训练数据绑定与冻结切分(节选)

training_data:

refs:

- "EFT.WP.Data.DatasetCards v1.0:Ch.11" # splits & distribution

- "EFT.WP.Data.DatasetCards v1.0:Ch.12" # quality & baselines

splits_ref: "eift.obs.demo@v1.0" # 冻结切分引用

contamination_policy: "forbid-cross-split"

(模型卡引用数据事实,禁止复制;引用携带版本与锚点。)


VIII. 评测与校准(节选)

evaluation:

protocol: {splits:"frozen", seeds:[0,1,2,3,4], repeats:5,

significance:{test:"permutation", alpha:0.05}}

metrics: [{name:"f1_macro"}, {name:"roc_auc"}, {name:"ece"}, {name:"brier"}]

calibration:

method: "temperature"

params: {t: 1.7}

report: {ece: 0.018, brier: 0.072}

(显著性与覆盖指标与质量/计量章一致。)


IX. 导出清单与引用(export_manifest 片段)

export_manifest:

version: "v1.0"

artifacts:

- {path:"model_card.yaml", sha256:"..."}

- {path:"eval/summary.csv", sha256:"..."}

references:

- "EFT.WP.Core.DataSpec v1.0:EXPORT"

- "EFT.WP.Core.Metrology v1.0:check_dim"

- "EFT.WP.Core.Equations v1.1:S20-1"

(导出物必须含 version 与 references[],引用携带卷名+版本+锚点。)


X. 键模式与最小正则


XI. see[] 与跨卷依赖映射(示例)

see:

- "EFT.WP.Data.DatasetCards v1.0:Ch.11"

- "EFT.WP.Core.Metrology v1.0:check_dim"

- "EFT.WP.Core.Equations v1.1:S20-1"

(按固定格式与 P/S/M/I 锚点类型进行条文级引用优先。)


XII. 本章合规自检


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/