目录 / 文档-技术白皮书 / 16-EFT.WP.Methods.Cleaning v1.0
一句话目标:统一 unit(x) 与 dim(x),完成仿射单位转换与量纲守恒校核,使任何进入发布面的表达满足 check_dim(expr) = true 并形成可审计计量闭环。
I. 范围与对象
- 适用对象
- 第3章产出的 D_std 全部数值字段与其 unit(x)、dim(x) 声明。
- 与到达时、路径、时间映射、密度归一相关的全部导出量与中间量。
- 目标产物
产出 D_metric(计量一致化后数据)与 report.units(转换与校核报告),并在 manifest 中记录转换链、失败列表与不确定度传播摘要。
II. 名词与变量(记忆锚点)
- 单位与量纲:unit(x),dim(x),check_dim(expr)。
- 不确定度:u(x),U = k * u_c。
- 时间与路径:tau_mono,ts,offset,skew,J,Delta_t,gamma(ell),d ell,L_gamma。
- 到达时两口径:T_arr_form1 = ( 1 / c_ref ) * ( ∫ n_eff d ell ),T_arr_form2 = ( ∫ ( n_eff / c_ref ) d ell ),delta_form = | T_arr_form1 - T_arr_form2 |。
- 冲突名强制:T_fil ≠ T_trans,n ≠ n_eff。
III. 公设(P104-*)
- P104-01 SI 一致公设
统一采用 SI 与兼容导出单位;角度用 rad,温度用 K,概率密度无量纲。 - P104-02 仿射转换公设
任意单位转换等价为仿射映射 x_SI = a * x + b,其中 b ≠ 0 仅用于带零点偏移的单位(如摄氏温度)。 - P104-03 量纲守恒公设
发布前必须满足 check_dim( y - f(x) ) = true,任何量纲不匹配均视为契约失败。 - P104-04 显式单位公设
任一数值字段必须声明 unit(x) 与 dim(x),不得以注释或名称隐含。 - P104-05 不确定度伴随公设
任一数值转换或函数映射均需更新 u(x) 并在 manifest 记录传播口径与覆盖因子 k。
IV. 最小方程(S104-*)
- S104-01 仿射单位转换
x_SI = a * x + b
u(x_SI) = |a| * u(x) - S104-02 量纲代数
dim(x * y) = dim(x) + dim(y)
dim(x / y) = dim(x) - dim(y)
dim(x ^ p) = p * dim(x)
dim( x + y ) 定义当且仅当 dim(x) = dim(y) - S104-03 时间与路径量纲检查
dim(tau_mono) = [T],dim(ts) = [T],dim(ell) = [L],dim(L_gamma) = [L]
dim(c_ref) = [L][T]^-1,dim(n_eff) = [1],dim(T_arr_form1) = dim(T_arr_form2) = [T] - S104-04 检查算子
check_dim( y - f(x) ) = true ⇔ dim(y) = dim(f(x)) - S104-05 不确定度传播(线性近似)
u^2(y) = sum_j ( ( ∂f / ∂x_j )^2 * u^2(x_j) )
若存在相关:u^2(y) += 2 * sum_{i<j} ( ( ∂f / ∂x_i )( ∂f / ∂x_j ) * cov(x_i, x_j) ) - S104-06 密度与归一量纲
概率密度:( ∫_Omega p(x) dx ) = 1,dim(p) = [1]
物理密度示例:dim(rho) = [M][L]^-3,守恒检测 sum_i( rho_i * DeltaV_i ) = const ± tol_mass
V. 规范单位表(默认口径)
- 基本:[L]=m,[T]=s,[M]=kg,[Θ]=K,[I]=A,[N]=mol,[J]=cd
- 常用导出:
- 速度 m/s,加速度 m/s^2,压力 Pa,能量 J,功率 W,频率 Hz,角速度 rad/s
- 路径弧长 ell: m,到达时 T_arr: s,参考光速 c_ref: m/s,n_eff: 1
- 时间戳:内部 tau_mono: s,发布 ts: s 或 ms,必须在清单中显式标注
VI. 清洗流程(M10-4 计量一致化)
- 字段扫描与补全
遍历数值字段,补全缺失的 unit(x) 与 dim(x);缺失项进入隔离并给出候选推断。 - 单位合法性与白名单校验
检查 unit(x) 是否在策略白名单;不在则拒绝或映射到最近等价单位。 - 仿射转换到规范单位
计算 x_SI = a * x + b,更新 u(x_SI) = |a| * u(x);对 ts 与 ell 执行标准化(如 ms → s,mm → m)。 - 量纲守恒校核
对关键信息执行 check_dim( y - f(x) ):- ts = map_to_pub( tau_mono ; offset, skew, J )
- T_arr_form1 与 T_arr_form2 的量纲一致性
- L_gamma = ( ∫_gamma 1 d ell ) 的单位一致性
- 记录转换链与不确定度
在 manifest.units 写入 from_unit → to_unit、a,b、u(x) → u(x_SI)、覆盖因子 k 与相关性假设。 - 生成报告与异常隔离
输出 report.units,包含 unit_conv_applied,dim_failures,u_propagated;失败分支打标签等待人工或策略修复。
VII. 契约与断言(本章必过项)
- 单位声明完整:forall x ∈ numeric_fields: exists unit(x) ∧ exists dim(x)
- 白名单通过:forall x: unit(x) ∈ policy.allowed_units(field)
- 仿射转换成功:forall x: convert_status(x) = ok
- 量纲守恒:check_dim( y - f(x) ) = true(至少覆盖 T_arr 两口径、L_gamma、时间映射)
- 不确定度伴随:forall x: defined u(x) 且转换后满足 u(x_SI) = |a| * u(x)
- 计量报告齐备:exists(report.units) 且与 manifest 对齐
VIII. 实现绑定(I10-4)
- 接口原型
- repair_units(ds, policy) -> report
- coerce_unit(field, to_unit) -> field'
- check_dim_set(ds, eqset) -> results
- propagate_uncertainty(ds, f, inputs) -> u(y)
- 前置条件
- policy 提供白名单、仿射参数 {a,b}、目标单位与相关性假设。
- ds 已满足第3章的键与索引契约。
- 后置条件与不变量
ds' 的数值字段均在规范单位;check_dim_set 全部通过;report.units 可重放;manifest.units 与数据版本一致。 - 失败语义
E_UNIT_UNKNOWN,E_DIM_MISMATCH,E_AFFINE_PARAM_MISSING,E_UNCERTAINTY_MISSING;均要求定位到字段与记录范围。
IX. 不确定度与常见算子传播
- 加法:y = x1 + x2 → u^2(y) = u^2(x1) + u^2(x2)(独立假设)
- 乘法:y = x1 * x2 → (u(y)/y)^2 = (u(x1)/x1)^2 + (u(x2)/x2)^2
- 比值:y = x1 / x2 → (u(y)/y)^2 = (u(x1)/x1)^2 + (u(x2)/x2)^2
- 幂律:y = x^p → u(y)/y = |p| * u(x)/x
- 仿射:y = a * x + b → u(y) = |a| * u(x)
X. 常见字段的单位口径与示例
- 时间
- tau_mono: s,ts: s(若源为 ms 则 a = 1e-3, b = 0)
- offset, skew, J: s 或以无量纲速率表示并在 manifest 说明
- 路径
- ell: m(若源为 mm 则 a = 1e-3)
- L_gamma: m,由 L_gamma = ( ∫_gamma 1 d ell ) 得出
- 到达时
- c_ref: m/s,n_eff: 1,T_arr: s
- 两口径必须量纲相同以通过 check_dim( T_arr_form1 - T_arr_form2 )
- 密度与归一
概率密度 p(x): 1,物理密度 rho: kg/m^3;归一误差 eps_norm 与守恒残差 res_mass 在第13章细化
XI. 自动化检查集(建议最小 eqset)
- check_dim( ts - map_to_pub( tau_mono ; offset, skew, J ) )
- check_dim( T_arr_form1 - T_arr_form2 )
- check_dim( L_gamma - ( ∫_gamma 1 d ell ) )
- check_dim( rho * dV ) 与归一化/守恒相关断言
XII. 审计与面板字段
- 面板最小集
unit_dim_filled,unit_conv_applied,dim_failures,arr_dim_ok,u_propagated,eps_norm,res_mass - 告警建议
dim_failures = 0,arr_dim_ok = 1,u_propagated = 1,eps_norm ≤ tol_norm,res_mass ≤ tol_mass
XIII. 交叉引用
- 标准输入与模式:见第3章。
- 时间轴与同步:见第5章。
- 路径与到达时:见第6章。
- 密度与归一:见第13章。
- 不确定度传播:见附录E。
- 契约与发布冻结:见第10章与附录B、C。
小结
本章以 P104-* 明确计量一致化的强约束,给出 S104-* 的仿射转换、量纲代数与不确定度传播方程,并以 M10-4 流程将 D_std 转化为 D_metric。完成后,关键表达(时间映射、路径长度、到达时两口径)全部通过 check_dim,转换链与不确定度在 manifest 留痕,为第5–6章的一致化处理与第10章发布冻结提供坚实计量基础。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/