目录 / 文档-技术白皮书 / 16-EFT.WP.Methods.Cleaning v1.0
一句话目标:以 tau_mono 统一内部时序,对外以 ts 发布;估计并记录 offset、skew、J,在窗口 Delta_t 内完成对齐、插补与重采样,同时保证单调与因果一致。
I. 范围与对象
- 适用对象
- 第4章后得到的 D_metric 中全部与时间相关的字段与派生量:tau_mono,ts,offset,skew,J,Delta_t。
- 多源数据的时钟对齐、单源漂移校正、事件对齐与发布节拍化。
- 目标产物
产出 D_time 与 manifest.timing = {tau_mono, ts, offset, skew, J, Delta_t, method, quality};对对齐过程中的异常、漂移、抖动给出可审计证据。
II. 名词与变量(记忆锚点)
- 基准与发布:tau_mono(内部评估基准),ts(对外发布时间)。
- 同步参数:offset(相位偏移),skew(时钟斜率偏差),J(抖动),Delta_t(窗口)。
- 运算与算子:map_to_pub( tau_mono ; offset, skew, J ),interp_{method}( x ; ts → grid ),resamp_{Delta_t}^{op}( x )。
- 约束:non_decreasing(tau_mono),non_decreasing(ts),coverage = 1 - mean(m)。
III. 公设(P105-*)
- P105-01 单调基准公设
tau_mono 必须单调:non_decreasing(tau_mono) = true。 - P105-02 发布映射公设
外部可见时间一律由 ts = map_to_pub( tau_mono ; offset, skew, J ) 给出,tau_mono 不对外发布。 - P105-03 窗口化估计公设
offset、skew、J 在窗口 Delta_t 内估计与落盘;跨窗口允许分段变化但需连续性约束与边界记录。 - P105-04 抖动显式公设
抖动 J 必须显式度量与发布,禁止以平滑掩盖瞬时偏差。 - P105-05 插补与因果公设
插补不得跨越 gap > gap_max;任何回填需保持事件因果顺序与 m 掩码一致。 - P105-06 多源一致公设
多源对齐以公共参考或共识法对齐,偏移以清单落盘,禁止隐式零偏移假设。
IV. 最小方程(S105-*)
- S105-01 线性映射与参数定义
ts ≈ a * tau_mono + b
skew = a - 1
offset = b - S105-02 抖动估计(稳健口径)
J = MAD( ts - ( a * tau_mono + b ) )
或 J^2 = Var( ts - ( a * tau_mono + b ) )(在无厚尾前提) - S105-03 窗口化最小二乘
a_w, b_w = argmin_{a,b} sum_{k ∈ window} w_k * ( ts_k - ( a * tau_mono_k + b ) )^2
skew_w = a_w - 1,offset_w = b_w - S105-04 粗对齐(互相关法)
lag* = argmax_lag corr( x_ref(t), x_i(t + lag) )
offset_i ← offset_i - lag* - S105-05 量纲检查
dim(ts) = [T],dim(tau_mono) = [T],dim(offset) = [T],dim(skew) = [1],dim(J) = [T]
check_dim( ts - ( a * tau_mono + b ) ) = true - S105-06 重采样与聚合
x_grid = interp_{method}( x ; ts → grid )
agg_{Delta_t}^{op}(x) = op( { x_k | ts_k ∈ bucket(Delta_t) } )
V. 同步问题分类与策略
- 时钟偏置为主(低漂移)
- 策略:全局 offset 估计(median 或加权均值),skew ≈ 0。
- 触发:|skew| ≤ tol_skew_lo 且 J ≤ tol_J_lo。
- 斜率偏差为主(稳定漂移)
- 策略:窗口化线性回归估计 a_w, b_w 并分段发布。
- 触发:|skew| > tol_skew_lo 且 J 可接受。
- 抖动为主(噪声/排队)
- 策略:保留 J,限制插补与聚合窗口,发布 P50/P95 时间偏差指标。
- 触发:J > tol_J_lo。
- 多源对齐(无共享时钟)
- 策略:参考流选取 + 互相关粗对齐 + 局部线性细化;偏移以清单记录。
- 触发:源间事件具相关结构或公共脉冲。
VI. 清洗流程(M10-5 时间轴与同步)
- 基准检查
验证 non_decreasing(tau_mono),若失败则回滚到第3章处理顺序或数据隔离。 - 初始粗对齐
若存在参考流,估计 lag* 并修正各源的初值 offset。 - 窗口化参数估计
在 Delta_t 内求解 a_w, b_w,得到 skew_w 与 offset_w,计算 J_w 与置信区间。 - 质量评估与分段
若 |skew_w| > tol_skew 或 J_w > tol_J,细分窗口或切换稳健回归(如 Huber 损失)。 - 发布映射
生成 ts_pub = a_w * tau_mono + b_w;保留 tau_mono 以供内部因果与回溯。 - 插补与重采样(可选)
对度量或模型需要的节拍执行 interp_{method} 与 agg_{Delta_t}^{op};缺失以 m 保持一致。 - 契约检查
断言 non_decreasing(ts_pub),check_dim( ts_pub - ( a_w * tau_mono + b_w ) ),并核对 coverage。 - 清单落盘
写入 manifest.timing:{Delta_t, a_w, b_w, offset_w, skew_w, J_w, method, quality};生成可审计残差统计。 - 产物输出
输出 D_time,并将 ts ← ts_pub 进入后续章节使用。
VII. 契约与断言(本章必过项)
- 单调性:non_decreasing(ts) = true
- 量纲守恒:check_dim( ts - ( a * tau_mono + b ) ) = true
- 抖动上限:J ≤ tol_J(窗口级)
- 斜率上限:|skew| ≤ tol_skew(窗口级)
- 粗对齐一致:|offset_ref - median(offset_i)| ≤ tol_offset(多源)
- 覆盖与插补:coverage ≥ q_min_coverage 且 gap_inserted ≤ gap_max
- 清单完整:exists(manifest.timing) 且字段齐全
VIII. 实现绑定(I10-5)
- 接口原型
- align_timebase(ds, sync_ref) -> ds'
- estimate_clock_linear(ds, window) -> {a_w, b_w, J_w, quality}
- coarse_align_by_xcorr(sig_ref, sig_i) -> lag*
- publish_map(tau_mono, a_w, b_w) -> ts_pub
- resample(ds, grid, method, op) -> ds'
- 不变量与后置条件
- ts_pub 单调且通过量纲检查;manifest.timing 可复现;多源偏移记录可追溯。
- 任意插补/重采样均保持 m 与来源标签,避免隐式造数。
- 失败语义
E_NON_MONOTONIC,E_REGRESS_FAIL,E_XCORR_WEAK,E_JITTER_EXCESS;均要求定位窗口与时间段。
IX. 高频场景作业指导
- 设备时钟跳变
- 诊断:|Δ( ts - a * tau_mono )| > theta_leap。
- 处置:切段前后独立估计 a_w, b_w,在清单标注 leap_event。
- 多源合并
选择参考流(噪声最小或覆盖最长),执行互相关粗对齐,再做窗口化线性细化,最后以 ts_pub 统一发布。 - 高抖动流
不平滑,不重排;发布 J 的 P50/P95,并缩短 Delta_t 控制局部模型误差。
X. 审计与面板字段
- 面板最小集
skew_w,offset_w,J_w,R2_w 或稳健替代,leap_events,gap_stats,coverage - 告警建议
|skew_w| > tol_skew,J_w > tol_J,leap_events > 0,coverage < q_min_coverage
XI. 交叉引用
- 单位与量纲(量纲检查与单位口径):见第4章。
- 路径与到达时(两口径与路径测度):见第6章。
- 去重与参照完整性(时间排序相关):见第9章。
- 契约与发布冻结:见第10章。
- 质量评分与审计:见第14章。
- 接口与策略汇总:见附录A、附录B、附录C。
小结
本章给出从 tau_mono 到 ts 的统一映射、窗口化参数估计与抖动度量,形成可复现的 manifest.timing 与单调发布时间轴。完成后,数据具备跨源对齐与节拍统一的时间基础,为第6章的路径与到达时处理、以及第10章发布冻结与审计提供可靠的时序支撑。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/