目录 / 文档-技术白皮书 / 52-数据集卡 Template v1.0
I. 目标与范围(Purpose & Scope)
- 统一数据集的采集、结构、质量与发布规范,覆盖来源/血缘、Schema 与单位/量纲、切分与版本/新鲜度、质量门与完整性、不确定度与协方差、偏倚/伦理/隐私、接口与访问,以及基准与对比评分。
- 适用:批处理、流式与近实时数据集;涉及路径量(到达时/相位)时,正文显式路径 gamma(ell) 与测度 d ell,数据侧记录 delta_form ∈ {general, factored};发布要求 p_dim = 1.0。
II. 读者与使用(Audience & Use)
- 读者:采集/实验负责人、数据工程与治理、计量与审校、基准与发布负责人、接口/系统集成。
- 使用:按章节执行字段与流程规范;产出 DS_EXPORT/ 目录及机读清单,供管线/参数/误差/协议各卷引用与发布。
III. 规范性引用(Normative References)
- 见《EFT.WP.Core.Terms v1.0》P10-*、见《EFT.WP.Core.Equations v1.1》Ch.2 S20-1/S21-2、见《EFT.WP.Core.Metrology v1.0》check_dim、见《EFT.WP.Core.DataSpec v1.0》TARR。
- 见《参数注册卡 Template v1.0》Ch.9、见《误差预算卡 Template v1.0》Ch.5/Ch.6/Ch.8/Ch.9、见《管线卡 Template v1.0》Ch.12/Ch.9/Ch.11、见《实验协议卡 Template v1.0》Ch.5。
- 引用一律“卷名 + 版本 + 锚点(P/S/M/I)”,锚点直指率 ≥ 90%,禁止外链与别名;对外仅允许 v1.*。
IV. 写作与排版(Style & Numbering)
- 小节标题用罗马数字并加粗;项目符号用“- 空格”;编号列表用“1. 空格”。
- 内联符号一律用反引号(如 T_arr、Phi、n_eff、c_ref);任何带除号、积分或复合算符的表达必须加括号并声明路径与测度。
- 冲突名强制:T_fil(张力)≠ T_trans(透射系数);n(数密度)≠ n_eff(有效折射率);禁止裸用 c、T、n。
- 到达时两口径(统一示例):
T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )
T_arr = ( ∫ ( n_eff / c_ref ) d ell )
V. 产出与目录(Deliverables & Layout)
- 必交付:
- 图表:规模与分布、缺失与质量、路径剖面与区间、基准与对比评分。
- 表格:字段 Schema 快照、质量门合规(G1–G8)、关键指标与区间、切分与版本。
- 报告与清单:schema.json、contract.yaml、split.yaml、validate_report.json、check_dim_report.json、privacy_policy.yaml(如适用)、audit.jsonl、report_manifest.yaml、签名 SIGNATURE.asc。
- 推荐目录:DS_EXPORT/figs|tables|reports|manifests/;所有数值产出显式单位,含除号/积分/复合算符必须加括号。
VI. 质量门与停止(Gates & Stops)
- G1 Schema 完整|G2 引用合规|G3 路径规范|G4 量纲闭合|G5 新鲜度|G6 覆盖口径|G7 协方差一致|G8 唯一性。
- 触发 S1–S5(量纲失败/新鲜度失效/路径缺失/协方差失配/引用不合规)即阻断发布,必要时进入 [Restricted] 并仅发布定性趋势与诊断图。
VII. 校验与发布流程(Validation & Release Flow)
- 运行 /validate 取得 G1–G8 状态与 stops_triggered;I70-dim_check 通过(p_dim = 1.0)。
- 生成 report_manifest.yaml 与校验和/签名;audit.jsonl 记录来源、版本、切分与所有改动。
- 与参数/误差/管线/协议卷交叉核对 see[]/references[]/version 与 cov_group/coverage 一致性。
- 对外发布仅引用 v1.*;锚点直指率 ≥ 90%;不合规项标注 [Restricted]。
VIII. 机读最小清单(Machine-Readable Minimum)
- schema.json:字段/单位/量纲/约束;
- contract.yaml:数据契约与路径块(gamma/measure/delta_form);
- split.yaml:切分方案与防泄漏规则;
- validate_report.json:门与停止结果;
- check_dim_report.json:量纲闭合;
- audit.jsonl:事件流;
- report_manifest.yaml:产出清单与校验和。
IX. 执行勾选清单(Checklist)
- schema.json/contract.yaml/split.yaml 完整且一致;see[]/references[] 合规,锚点直指率 ≥ 90%。
- 路径量显式 gamma(ell)、d ell;数据侧记录 delta_form;len(path) ≥ 2、Δell 合规。
- I70-dim_check 通过、p_dim = 1.0;覆盖口径统一(k/alpha/quantile)。
- 质量门 G1–G8 全部通过或已按 S1–S5 处置;隐私/偏倚合规文件齐全(如适用)。
- DS_EXPORT/ 目录含图表/表格/报告/清单与签名;对外发布仅 v1.*,不合规产出标注 [Restricted]。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/