目录 / 文档-技术白皮书 / 52-数据集卡 Template v1.0
I. 术语(Terms)
- sample(样本):数据集中最小记录单元。
- feature(特征):可用于建模/统计的字段。
- label(标签):目标/监督字段。
- metadata(元数据):描述数据及生成过程的附加信息。
- split(切分):train/val/test/holdout/slice_k 等数据子集。
- window/partition(窗口/分区):时间/空间/实体上的聚合单元。
- contract/schema(契约/模式):字段、类型、单位、量纲与约束的声明。
- coverage(覆盖口径):k 覆盖/alpha 显著性/quantile[p_lo,p_hi]。
- lineage(血缘):来源链与依赖图(DAG)。
II. 符号(Symbols,最小集)
- 规模:N(样本数),M(特征数),|split|(切分大小)。
- 时间与采样:f_s(采样率),T_win(窗口),ts_start/ts_end(ISO-8601)。
- 路径量:gamma(ell)(路径),d ell(测度),n_eff(ell)(有效折射率),c_ref(参考传播上限),λ_ref(参考波长),T_arr(到达时),Phi(相位)。
- 质量与不确定度:Q_res,u(x),u_c,U = k·u_c,Σ(协方差),p_dim。
- 同步健康:δt_abs(绝对时偏差),Δτ_ch(通道偏置),σ_y(τ)(Allan 偏差)。
- 资源/性能(如适用):Latency_P95,Throughput,ρ(利用度)。
III. 单位与量纲(Units & Dimensions)
- SI 与国际符号:m, s, rad, 1, m/s, 1/m, Pa, N, J, Hz。
- 字段表必须给出 unit 与(或)在契约中声明量纲 dim。
- 量纲闭合要求:全书发布前通过 I70-dim_check,p_dim = 1.0,随附 check_dim_report.json。
IV. 路径量统一口径(Normative Path Forms)
- 到达时(两种等价):
T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )
T_arr = ( ∫ ( n_eff / c_ref ) d ell ) - 相位累计:
Phi = ( 2π / λ_ref ) * ( ∫ n_eff d ell )
正文显式 gamma(ell) 与 d ell;数据侧记录 delta_form ∈ {general, factored};路径阵列满足 len(gamma_ell)=len(d_ell)=len(n_eff)≥2。
V. 写法与歧义规避(Mandatory Conventions)
- 反引号包裹内联符号(如 T_arr、Phi、n_eff、c_ref)。
- 括号强制:含除号/积分/复合算符的表达必须加括号;ln/exp/conv 使用函数式。
- 冲突名强制:T_fil(张力)≠ T_trans(透射系数);n(数密度)≠ n_eff(有效折射率)。
- 禁止裸用:c、T、n。
- 覆盖口径一致:数据侧与发布侧在 k/alpha/quantile 三者中选其一并保持一致。
VI. 字段表(最小模板)
字段 | 类型 | 单位 | 量纲 | 取值域/形状 | 可空 | 说明 | see |
|---|---|---|---|---|---|---|---|
record_id | string | 1 | 1 | ULID/UUIDv4 | 否 | 主键 | — |
acq.ts_start/ts_end | string | 1 | 1 | ISO-8601 | 否 | 采集时间 | — |
path.gamma_ell | array | m | L | N≥2 | 否 | 路径参数 | Core.DataSpec:TARR |
path.d_ell | array | m | L | N≥2 | 否 | 路径测度 | 同上 |
medium.n_eff_profile | array | 1 | 1 | N≥2 | 否 | 有效折射率 | S20-1 |
ref.c_ref | number | m/s | L·T^-1 | (2.9e8,3.1e8) | 否 | 参考上限 | Terms P10-* |
ref.lambda_ref | number | m | L | >0 | 视任务 | 参考波长 | S21-2 |
obs.T_arr | number | s | T | — | 视任务 | 到达时 | S20-1 |
obs.Phi | number | rad | 1 | — | 视任务 | 相位 | S21-2 |
quality.flags | array | 1 | 1 | — | 可空 | 质量标记 | — |
quality.score_Q | number | 1 | 1 | [0,1] | 否 | 稳健质量 | — |
see/references/version | array/string | 1 | 1 | — | 否 | 引用与版本 | — |
VII. 机读契约(Machine-Readable Contracts,节选)
A. schema.json
{
"$schema": "https://json-schema.org/draft/2020-12/schema",
"title": "Dataset v1.0.0 (minimal)",
"type": "object",
"required": ["record_id","acq","path","medium","ref","see","version"],
"properties": {
"record_id": { "type": "string" },
"acq": {
"type": "object",
"required": ["ts_start","ts_end"],
"properties": {
"ts_start": { "type": "string", "format": "date-time" },
"ts_end": { "type": "string", "format": "date-time" }
}
},
"path": {
"type": "object",
"required": ["gamma_ell","d_ell"],
"properties": {
"gamma_ell": { "type": "array", "items": { "type": "number" }, "minItems": 2 },
"d_ell": { "type": "array", "items": { "type": "number" }, "minItems": 2 }
}
},
"medium": {
"type": "object",
"required": ["n_eff_profile"],
"properties": {
"n_eff_profile": { "type": "array", "items": { "type": "number" }, "minItems": 2 }
}
},
"ref": {
"type": "object",
"properties": {
"c_ref": { "type": "number" },
"lambda_ref": { "type": "number" }
}
},
"see": { "type": "array", "items": { "type": "string" }, "minItems": 1 },
"version": { "type": "string" }
}
}
B. contract.yaml(路径块与覆盖声明)
version: "1.0.0"
path:
required: true
gamma: "gamma(ell)"
measure: "d ell"
delta_form: "general" # or "factored"
coverage:
mode: "k" # k | alpha | quantile
k: 2
units:
T_arr: "s"
Phi: "rad"
c_ref: "m/s"
lambda_ref: "m"
VIII. 规范示例(Normative Examples)
- 路径一致性检查:
len(gamma_ell)=len(d_ell)=len(n_eff)≥2;Δell ≤ ( c_ref / f_s ) / max(n_eff)。 - 相位区间报告:Fisher–z 变换区间 → 反变换回 r_phi 并给出 [LB,UB]。
- 量纲校核示例:
T_arr = ( ∫ ( n_eff / c_ref ) d ell ) ⇒ [1]/[m·s^-1]·[m] = [s]。
IX. 反例与修正(Anti-Patterns & Fixes)
- 反例:T_arr = ∫ n_eff / c_ref d ell(缺括号)→ 修正:T_arr = ( ∫ ( n_eff / c_ref ) d ell )。
- 反例:仅声明 gamma(ell),缺 d ell/delta_form → 修正:补齐并与 n_eff 对齐。
- 反例:单位用文本 % → 修正:单位用 1,并在注释中说明“百分比”。
- 反例:引用无版本/锚点 → 修正:见《EFT.WP.Core.Equations v1.1》Ch.2 S20-1。
X. 执行勾选清单(Checklist)
- 字段表与 schema.json/contract.yaml 一致;所有数值字段显式单位与量纲。
- 路径量显式 gamma(ell)/d ell,并记录 delta_form;len(path) ≥ 2、Δell 合规。
- 统一口径:到达时两式与相位公式均已采用括号化写法。
- 覆盖口径在数据与发布侧一致(k/alpha/quantile);p_dim = 1.0 且已附 check_dim_report.json。
- see[]/references[]/version 合规且锚点直指率 ≥ 90%;禁止外链与别名。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/