目录 / 文档-技术白皮书 / 16-EFT.WP.Methods.Cleaning v1.0
I. 目的与范围
- 交付“从原始到可发布”的清洗闭环:模式绑定 → 计量一致 → 时基对齐 → 路径一致 → 质量与契约 → 发布冻结。
- 本卷面向离线批处理、在线服务、事件流三类场景,定义清洗域的公设 P10x-*、最小方程 S10x-*、流程 M10-* 与实现绑定 I10-*。
- 与配套卷协同:时间语义与到达时口径遵循 tau_mono/ts 与“两口径”统一规则;密度与测度遵循显式测度与单位/量纲守恒的统一口径。
II. 读者与适用边界
- 读者:数据平台与清洗工程、计量与质量、建模与算法、运维与审计。
- 适用边界:不覆盖硬件实现细节与分布式存储内部机制;仅给出接口与约束。
- 阅读路径:先读第1–2章(定义与公设),再按项目选择第3–10章中的专项清洗,最后参见附录的契约库与接口参考。
III. 与配套白皮书的接口
- 与《Core.Sea》:
- 时间基准采用 tau_mono(内部评估)与 ts(对外发布),并显式记录 offset/skew/J;若以到达时校准,需报告路径与两口径差 delta_form。
- 设备/通道/清单字段与质量监测条款(如 q_score, m ∈ {0,1}, drift)复用其最小字段集。
- 与《Core.Density》:
任何涉及积分与密度的表达必须显式给出域与测度(如 dV/dx/dS/d ell);若时间对齐依赖到达时,清洗产出需带两口径字段并审计一致性。 - 与《Core.Terms》:
严格区分 n(数密度)与 n_eff(有效折射率),T_fil(张度场)与 T_trans(透射系数)不得混用;到达时沿用统一表述与路径/测度显式规则。
IV. 记号、编号与发布纪律
- 统一编号:公设 P10x-?,最小方程 S10x-?,清洗流程 M10-*,实现绑定 I10-*。
- 文本与排版:小节标题用罗马数字并加粗;项目符号用 “- 空格”;编号列表用 “1. 空格”。
- 变量与公式:全部英文与纯文本;内联统一反引号包裹(如 phi(x,t), Xi(x,t), K, Q, T_fil, T_trans, n_eff);含除号/积分/复合算符的表达一律加括号并显式路径与测度 gamma(ell), d ell。
- 单位与量纲:发布前执行 check_dim(expr);禁止无量纲与有量纲对象混写。
V. 到达时“两口径”与时间语义(清洗锚点)
- 两口径统一式:
- 常量外提:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )
- 一般口径:T_arr = ( ∫ ( n_eff / c_ref ) d ell )
- 差异度量:delta_form = | ( 1 / c_ref ) * ( ∫ n_eff d ell ) - ( ∫ ( n_eff / c_ref ) d ell ) |
- 使用 T_arr 时必须同时给出 gamma(ell), d ell, c_ref, n_eff 并记录 delta_form。
- 时间语义:所有清洗内评估在 tau_mono 上完成,对外仅以 ts 发布;offset/skew/J 的估计需伴随不确定度与窗口 Delta_t。
VI. 输入/输出、契约与出厂条件
- 输入:D_raw 及其 manifest(含 schema_ver, units, support, timing)。
- 输出:D_clean 与 manifest;至少包含:
- arrival_forms = {T_arr(two forms), delta_form, gamma(ell), d ell, c_ref, n_eff}
- timing = {tau_mono, ts, offset, skew, J}
- qc = {q_score, m, drift}
- contracts = {unique, monotone(ts|ell), check_dim, eps_norm/eps_mass, tol_Tarr}。
VII. 统一符号与定义(本卷记忆)
- 路径与测度:gamma(ell) 为按弧长参数化的路径;d ell 为线元测度;L_gamma = ( ∫_gamma 1 d ell )。
- 时间与同步:tau_mono(内部评估),ts(发布);派生量 offset, skew, J。
- 到达时:T_arr 两口径与 delta_form(见上)。
- 密度与测度:rho(x,t)(具量纲),p(x)(无量纲,( ∫ p(x) dx ) = 1);发布需显式域与测度。
- 冲突名强制:T_fil ≠ T_trans;n ≠ n_eff;禁用裸 c/T/n。
VIII. 清洗目标、读者可执行路径与产出
- 目标:
以 P/S/M/I 形成可审计闭环:pass = check_dim ∧ arrival_forms ∧ contract_ok ∧ manifest_signed。 - 可执行路径:
- 第1章建立清洗定义与范围;
- 第2章固化公设与最小方程;
- 第3–10章按对象与流程落地接口 I10-*;
- 第11–12章处理流式与到达时一致化;
- 第13–15章完成归一化、质量审计与用例发布。
- 产出:
- 标准清洗清单与契约库;
- assert_contract 报告与 freeze_release 的发布工件;
- 与《Core.Sea》《Core.Density》对齐的 T_arr/测度/时基字段,确保跨卷一致与可追溯。
IX. 约定复述(一览)
- 版式与层级:罗马数字小节、- 项目符号、1. 编号;内联符号反引号包裹。
- 两口径与路径:任一到达时/路径相关清洗均同时计算两口径并落盘 delta_form,显式 gamma(ell) 与 d ell。
- 单位与量纲:所有表达通过 check_dim(expr) 校核;密度与概率的测度与单位明确。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/