目录文档-技术白皮书06-EFT.WP.Core.DataSpec v1.0

第2章 模式与字段字典


I. 类型系统与基本约束


II. 字段词条结构与注册流程

  1. 字段词条最小集合:
    name、desc、type、unit、dim、nullable、default、aliases、roles、see。
  2. 词条命名规则:使用 snake_case、ASCII、小写;量纲与单位不出现在 name,仅出现在 unit 与 dim。
  3. 角色标注:roles ⊆ {key,time,geom,measure,quality,mask,meta,index}。
  4. 注册流程(对应 I60):
    • 使用 register_field(name, type, unit, dim, desc, aliases) 建立词条;
    • register_schema(name, version, fields, constraints, units, pk, idx, see) 组装模式;
    • 以 validate_dataset(schema, ds, strict=True) 校验落盘数据;
    • 以 export_schema(SRef,"yaml") 出版并冻结。

III. 单位与量纲绑定规范

  1. 绑定要求:
    • 任一参与方程的字段必须给出 unit(·) 与 dim(·) 并通过 check_dim( y - f(x; theta) )。
    • 只允许仿射单位转换:v_to = a * v_from + b,其中 b ≠ 0 仅用于零点偏移(如 degC ↔ K)。
    • 在规范 t0 = L0 / c_ref 下,被积项 ( n_eff / c_ref ) * d ell 可写作 bar_n_eff * d bar_ell 且视为无量纲,其中 bar_n_eff = n_eff,d bar_ell = d ell / L0。
  2. 到达时两口径字段绑定:
    • 常量外提:T_arr = ( 1 / c_ref ) * ( ∫_gamma n_eff d ell )。
    • 一般口径:T_arr = ( ∫_gamma ( n_eff / c_ref ) d ell )。
    • 差异度量:delta_form = | ( 1 / c_ref ) * ( ∫_gamma n_eff d ell ) - ( ∫_gamma ( n_eff / c_ref ) d ell ) |。

IV. 可空性、默认与缺失策略


V. 标准字段字典(示例 40 条)


VI. 复合类型与结构化字段


VII. 契约与验证映射

典型契约(映射到 assert_contract):

VIII. 索引与排序规范

  1. 必备索引:
    • 时间序列:idx(ts) 与复合 idx(uid, ts)。
    • 路径序列:idx(pid, ell);可选空间索引 idx(lon, lat)。
  2. 排序保存:落盘与导出均以主键顺序或 (pid, ell)、(uid, ts) 顺序输出,保证幂等重放。

IX. 到达时数据集的绑定要点

  1. 必备字段集:pid、ell、n_eff(若可得)、c_ref、ts(若时变)与几何字段、CRS。
  2. 计算与核验:
    • 以选定口径计算 T_arr;
    • 计算 delta_form 并与阈值比较;
    • 以 check_dim 校验 T_arr 的 dim("[T]");
    • 将 RefCond 与路径测度 d ell 写入 manifest。

X. 模式演进与兼容性策略

  1. 版本语义:major 破坏性、minor 向后兼容、patch 文档与元数据修订。
  2. 演进规则:
    • 字段重命名:保留旧名于 aliases 至少一个发布周期,并在 diff_datasets 给出映射。
    • 新增字段:默认必须 nullable=True 或具备 default。
    • 删除字段:major+1,并在 import_manifest 提供兼容适配层。

XI. 字段词条模板(文本)

name=<snake_case>; type=<dtype>; unit=<SI|1|compound>; dim=<dimstr>; nullable=<True|False>; default=<value|None>; roles={<...>}; aliases=[...]; desc=<one-line>; see=[<Sxx-?>,<I60-?>,<DS.*>]

XII. 单位/量纲绑定示例(20 例)


XIII. 与实现接口(I60-*) 的对照清单


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/