目录文档-技术白皮书(V5.05)06-EFT.WP.Core.DataSpec v1.0

第2章 模式与字段字典


I. 类型系统与基本约束


II. 字段词条结构与注册流程

  1. 字段词条最小集合:
    name、desc、type、unit、dim、nullable、default、aliases、roles、see。
  2. 词条命名规则:使用 snake_case、ASCII、小写;量纲与单位不出现在 name,仅出现在 unit 与 dim。
  3. 角色标注:roles ⊆ {key,time,geom,measure,quality,mask,meta,index}。
  4. 注册流程(对应 I60):
    • 使用 register_field(name, type, unit, dim, desc, aliases) 建立词条;
    • register_schema(name, version, fields, constraints, units, pk, idx, see) 组装模式;
    • 以 validate_dataset(schema, ds, strict=True) 校验落盘数据;
    • 以 export_schema(SRef,"yaml") 出版并冻结。

III. 单位与量纲绑定规范

  1. 绑定要求:
    • 任一参与方程的字段必须给出 unit(·) 与 dim(·) 并通过 check_dim( y - f(x; theta) )。
    • 只允许仿射单位转换:v_to = a * v_from + b,其中 b ≠ 0 仅用于零点偏移(如 degC ↔ K)。
    • 在规范 t0 = L0 / c_ref 下,被积项 ( n_eff / c_ref ) * d ell 可写作 bar_n_eff * d bar_ell 且视为无量纲,其中 bar_n_eff = n_eff,d bar_ell = d ell / L0。
  2. 到达时两口径字段绑定:
    • 常量外提:T_arr = ( 1 / c_ref ) * ( ∫_gamma n_eff d ell )。
    • 一般口径:T_arr = ( ∫_gamma ( n_eff / c_ref ) d ell )。
    • 差异度量:delta_form = | ( 1 / c_ref ) * ( ∫_gamma n_eff d ell ) - ( ∫_gamma ( n_eff / c_ref ) d ell ) |。

IV. 可空性、默认与缺失策略


V. 标准字段字典(示例 40 条)


VI. 复合类型与结构化字段


VII. 契约与验证映射

典型契约(映射到 assert_contract):

VIII. 索引与排序规范

  1. 必备索引:
    • 时间序列:idx(ts) 与复合 idx(uid, ts)。
    • 路径序列:idx(pid, ell);可选空间索引 idx(lon, lat)。
  2. 排序保存:落盘与导出均以主键顺序或 (pid, ell)、(uid, ts) 顺序输出,保证幂等重放。

IX. 到达时数据集的绑定要点

  1. 必备字段集:pid、ell、n_eff(若可得)、c_ref、ts(若时变)与几何字段、CRS。
  2. 计算与核验:
    • 以选定口径计算 T_arr;
    • 计算 delta_form 并与阈值比较;
    • 以 check_dim 校验 T_arr 的 dim("[T]");
    • 将 RefCond 与路径测度 d ell 写入 manifest。

X. 模式演进与兼容性策略

  1. 版本语义:major 破坏性、minor 向后兼容、patch 文档与元数据修订。
  2. 演进规则:
    • 字段重命名:保留旧名于 aliases 至少一个发布周期,并在 diff_datasets 给出映射。
    • 新增字段:默认必须 nullable=True 或具备 default。
    • 删除字段:major+1,并在 import_manifest 提供兼容适配层。

XI. 字段词条模板(文本)

name=<snake_case>; type=<dtype>; unit=<SI|1|compound>; dim=<dimstr>; nullable=<True|False>; default=<value|None>; roles={<...>}; aliases=[...]; desc=<one-line>; see=[<Sxx-?>,<I60-?>,<DS.*>]

XII. 单位/量纲绑定示例(20 例)


XIII. 与实现接口(I60-*) 的对照清单


版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05