目录 / 文档-技术白皮书 / 45-EFT.WP.Data.Pipeline v1.0
I. 章节定位与覆盖
- 定位:给出本卷采用的通用术语来源、增量术语表、统一符号与量纲基线;明确跨卷依赖及锚点写法,覆盖 pipeline/layers/edges/stage/operator/contract/schema/DQ gate/lineage/SLA/SLO/orchestrator 等流水线专用术语。
- 覆盖:命名风格与保留名、计量与单位口径、跨卷依赖映射、引用与锚点规范、路径量(如 T_arr)口径、机器可读依赖与导出清单。
II. 术语来源与版本锁定
- 通用术语:遵循《EFT 技术白皮书与技术备忘模板 全面清单 v0.1》,本卷仅对流水线相关术语做增量定义。
- 固定依赖集(最小集合):EFT.WP.Core.DataSpec v1.0、EFT.WP.Core.Metrology v1.0、EFT.WP.Core.Equations v1.1、EFT.WP.Data.DatasetCards v1.0、EFT.WP.Data.ModelCards v1.0。如需更高版本,须在 export_manifest.references[] 中显式声明。
- 条文级引用:跨卷引用必须包含“卷名 vX.Y:章节/锚点”,优先指向 P/S/M/I 锚点;禁止整卷泛引与别名。
III. 统一符号与记号(流水线增量)
- 流水线/拓扑:π(pipeline ID)、S(stage 集合)、E(edge 集合)、Σ_in/Σ_out(输入/输出 Schema)。
- 资源/性能:C_cpu(vCPU)、C_mem(GiB)、C_gpu(数量/型号)、QPS(吞吐)、T_inf(单样本时延,ms)、ρ(利用率)。
- 调度/可靠性:τ_cron(Cron 表达式)、p99(99 分位)、RTO/RPO。
- 隐私/安全:k_anon(k-匿名)、ε_dp(差分隐私预算)。
- 数学与符号规则:所有内联符号用反引号;含除号/积分/复合算符必须加括号并声明路径 gamma(ell) 与测度 d ell;公式/符号/定义禁用中文。
IV. 字段命名风格与保留名
- 命名风格:键名统一 snake_case;数组以 [] 表示复数字段。
- 保留名(不可重定义):pipeline.id、pipeline.version、layers[]、edges[]、resources、scheduling、quality_gates、export_manifest、metrology、monitoring、alert_rules、lineage。
- I/O 契约字段:schema_ref、compat_mode、evolution_policy 为契约相关保留键。
V. 跨卷依赖映射(最小依赖集)
- 数据契约/导出:EFT.WP.Core.DataSpec v1.0(文件组织、发布、export_manifest)。
- 计量/单位/误差:EFT.WP.Core.Metrology v1.0(units="SI", check_dim=true,误差预算)。
- 方程/路径量:EFT.WP.Core.Equations v1.1(Ch.2,S20-*:到达时 T_arr 等路径依赖表达)。
- 数据事实与切分:EFT.WP.Data.DatasetCards v1.0(来源/采样/切分/质量)。
- 特征与 I/O 假设:EFT.WP.Data.ModelCards v1.0(特征空间、任务 I/O)。
VI. 引用与锚点规范
- 固定写法:见《<卷名> vX.Y》Ch.<章> <锚点>;锚点类型:Pxx-?(公设)、Sxx-?(最小方程)、Mx-?(计量流程)、Ixx-?(实现绑定)。
- 机器可读引用:对象的 see[] 与导出清单 references[] 使用 "卷名 vX.Y:锚点";禁止短码、别名或缺版本引用。
- 示例:"EFT.WP.Core.DataSpec v1.0:EXPORT"、"EFT.WP.Core.Metrology v1.0:check_dim"、"EFT.WP.Core.Equations v1.1:S20-1"。
VII. 到达时 T_arr 的依赖口径(如适用)
- 两种等价表达:
- 常量外提:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )
- 一般口径:T_arr = ( ∫ ( n_eff / c_ref ) d ell )
- 登记要求:凡流水线涉及路径量(如 TOA 处理/校正),必须在相关 stage 的配置中登记 delta_form、path="gamma(ell)"、measure="d ell",并通过 check_dim。
VIII. 机器可读依赖与实现绑定
- see[] 示例:
- see:
- - "EFT.WP.Core.DataSpec v1.0:EXPORT"
- - "EFT.WP.Core.Metrology v1.0:check_dim"
- - "EFT.WP.Core.Equations v1.1:S20-1"
- 导出清单 export_manifest 片段:
- export_manifest:
- version: "v1.0"
- references:
- - "EFT.WP.Core.DataSpec v1.0:EXPORT"
- - "EFT.WP.Core.Metrology v1.0:check_dim"
- - "EFT.WP.Data.DatasetCards v1.0:Ch.11"
- artifacts:
- - {path:"pipeline.yaml", sha256:"..."}
- - {path:"dq/report.json", sha256:"..."}
IX. 实体与度量的计量基线
。先做单位归一统一采用 SI 单位与 check_dim=true;性能/资源类度量(如 QPS、T_inf、C_cpu、C_mem、功率 P)在字段表或 params 中标注单位;合成或换算前X. 本章合规自检
- 全部跨卷引用带“卷名 vX.Y:章/锚点”,优先 P/S/M/I 条目。
- 命名采用 snake_case,保留名未被重定义;I/O 契约字段使用 schema_ref/compat_mode/evolution_policy。
- 计量基线为 units="SI" 与 check_dim=true;性能/资源单位明确且一致。
- 如涉 T_arr 等路径量,已登记 delta_form/path/measure 并通过 check_dim。
- see[] 与 export_manifest.references[] 使用固定格式;不存在短码/别名/缺版本引用。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/