目录文档-技术白皮书43-EFT.WP.Data.DatasetCards v1.0

第5章 可选扩展字段


I. 章节目的与范围

的语义、触发条件与约束,覆盖伦理与合规、血缘、传感器画像、拓展计量、路径改正、扩展质量指标与分发增强等;存在即校验,不存在不报错;命名一律 snake_case,引用采用“卷名+版本+锚点”。 可选扩展字段定义

II. 分层与触发原则


III. 可选扩展字段总表

键名

类型

约束/正则

典型适用情形

交叉引用/锚点

lineage

string[]

dataset_id@version 列表

需要血缘追踪与审计轨

《Core.DataSpec v1.0》发布/组织。

related_artifacts

string[]

可解析 URI/路径

绑定脚本、配置、基线模型

导出清单 references[] 一致化。

sensor_profile

object

schema(见本章片段)

物理传感/台站/通道信息

方法/计量系卷。

privacy

object

policy/enum

涉及 PII/敏感信息

DataSpec 合规口径。

ethics

object

policy/enum

伦理披露与使用限制

发行策略一致化。

uncertainty

object

schema(误差预算/传播)

存在测量或推断不确定度

《Core.Metrology v1.0》《Core.Errors v1.0》。

path_corrections

object

schema(介质/线路改正)

路径依赖量需改正时

《Metrology.PathCorrection v1.0》。

timebase_sync

object

schema(时基与同步)

跨平台时频同步/切换

《Metrology.TimeBase/Sync v1.0》。

distribution

object

mirrors/shards/limits

高可用分发与镜像策略

《Core.DataSpec v1.0》导出策略。

notes

string

附加说明(非规范性)


IV. 字段规范与示例

1) lineage

2) related_artifacts

3) sensor_profile

4) privacy / ethics

5) uncertainty

6) path_corrections(路径改正)

7) timebase_sync(时基与同步)

8) distribution(分发增强)


V. 计量与路径依赖的一致性要求(适用于启用相关扩展时)

  1. 任何涉及 T_arr 的条目,必须在卡片中登记 delta_form、path="gamma(ell)"、measure="d ell",并通过 check_dim;两种等价表达并存:
    • T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )
    • T_arr = ( ∫ ( n_eff / c_ref ) d ell )。
  2. 公式内禁用中文;内联符号一律用反引号;含分式/积分/复合算符必须加括号

VI. 机器可读 Schema 片段(规范性)

# I15-5 Optional Extensions (excerpt)

properties:

lineage:

type: array

items: {type: string, pattern: "^[a-z0-9_\\-\\.]+@v\\d+\\.\\d+(\\.\\d+)?$"}

related_artifacts:

type: array

items: {type: string, minLength: 1}

sensor_profile:

type: object

properties:

instruments: {type: array, items: {type: object}}

channels: {type: array, items: {type: object, properties:{id:{type:string}, fs_hz:{type:number}, bw_hz:{type:number}, pol:{type:string}}}}

calibration: {type: object}

privacy:

type: object

properties: {policy:{type:string}, deidentification:{type:array, items:{type:string}}}

ethics:

type: object

properties: {intended_use:{type:array, items:{type:string}}, restrictions:{type:array, items:{type:string}}}

uncertainty:

type: object

properties:

components: {type: array}

combine: {type: string, enum: ["rss","linear","bayesian"]}

coverage: {type: string}

path_corrections:

type: object

properties:

models: {type: array, items:{type:string}}

parameters: {type: object}

uncertainty: {type: object}

see: {type: array, items:{type:string, pattern:"^[^:]+ v\\d+\\.\\d+:[A-Z].+$"}}

timebase_sync:

type: object

properties:

references: {type: array, items:{type:string}}

drift_ppb_max: {type: number}

switchover: {type: object, properties:{threshold_ppb:{type:number}, holdover_s:{type:number}}}

audits: {type: array, items:{type:string}}

distribution:

type: object

properties:

mirrors: {type: array, items:{type:string}}

shards: {type: array, items:{type: object, properties:{path:{type:string}, bytes:{type:integer}}}}

rate_limit: {type: object, properties:{mbps:{type:number}}}

see[] 与导出清单中的 references[] 必须采用 "卷名 vX.Y:锚点" 固定格式。

VII. 与导出清单的耦合(export_manifest 补充)

export_manifest:

references:

- "EFT.WP.Core.DataSpec v1.0:EXPORT"

- "EFT.WP.Core.Equations v1.1:S20-1"

- "EFT.WP.Metrology.PathCorrection v1.0:MODEL"

在 references[] 体现。 必须所有在本章启用的扩展字段,若引入跨卷依赖,

VIII. 本章合规自检


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/