目录文档-技术白皮书14-EFT.WP.Methods.Inference v1.0

第6章 在线/离线一致性


I. 范围与目标

  1. 定义并落实离线批推理 offline 与线上实时推理 online 的一致性目标、计量方法与通过门,覆盖时基对齐、窗口复刻、特征一致性、模型数值口径与系统运行差异的屏蔽策略。
  2. 目标产出:
    • 一致性度量与门限:delta_offon,R_infer = 1 - delta_offon,tau_offon;
    • 特征一致性与窗口复刻口径:delta_feat,window = {context, history, lookahead=0};
    • 时基对齐参数:alpha,beta 与拟合报告 fit;
    • 运行剧本与验收流:Mx-54 → Mx-58 的可执行步骤与回退条件。
  3. 适用读者:数据与特征工程、模型研发、推理与调度平台、SRE 与合规团队。

II. 术语与符号

  1. 结果与一致性:
    • y_hat_off(离线输出),y_hat_on(在线输出),delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) ),R_infer = 1 - delta_offon。
    • 决策一致性:err_decision = ( 1 / N ) * Σ 1[ argmax( y_hat_off ) != argmax( y_hat_on ) ]。
  2. 时基与窗口:
    • tau_mono(单调时基),ts(对外时标),ts = alpha + beta * tau_mono。
    • 事件时与处理时:t_ev,t_proc;水位 watermark;迟到阈值 lateness_max。
    • 窗口复刻 window = {context, history, lookahead=0};重放锚点 anchor。
  3. 特征与追溯:
    • 特征向量 phi(x,t);特征一致性 delta_feat = ( norm( phi_off - phi_on ) / norm( phi_off ) )。
    • 版本与签名:hash(·),fingerprint,EnvLock,ModelCard,PipelineCard。
  4. 谱与时域校核:
    S_xx(f)(功率谱密度),谱一致性差异 delta_psd,窗口函数 U_w 与 ENBW。
  5. 并发与可观测性:
    TS.latency,TS.thrpt,TS.error,hb(happens-before)。

III. 公设与最小方程

  1. P41-2 时基对齐公设
    对任意轨迹 trace 与参考 reference,经映射 ts = alpha + beta * tau_mono 后进行比对;跨设备与跨域一致性必须在共同时基上定义与验收。
  2. P41-9 窗口复刻公设
    在固定 window 与相同去重规则、迟到策略及 EnvLock 下,对同一 anchor 的数据切片,离线与在线的特征生成满足 delta_feat <= tau_feat。
  3. P41-10 推理等价公设(无漂移区间)
    当输入分布无显著漂移且模型图、量化与数值口径与 ModelCard 一致时,delta_offon <= tau_offon 且 err_decision <= tau_decision。
  4. S42-14 一致性度量(向量/标量统一口径)
    数据集 D = { x_i } 上:delta_offon(D) = ( norm( Y_off - Y_on ) / norm( Y_off ) ),其中 Y_* = concat_i y_hat_*(x_i)。
  5. S42-15 概率分布一致性
    若输出为分布 p_off(y|x) 与 p_on(y|x),可并行报告 D_KL = ( 1 / N ) * Σ KL( p_off || p_on ) 与分桶 ECE_off-on。
  6. S42-16 谱一致性
    对时间序列输出 z(t),delta_psd = ( ∫ | S_zz_off(f) - S_zz_on(f) | df ) / ( ∫ S_zz_off(f) df ),窗口与测度须声明 U_w 与 ENBW。
  7. S42-17 到达时窗口一致性
    • 若涉及到达时 T_arr,应并行计算两口径并记录差异 delta_form:
    • 常量外提:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell );一般口径:T_arr = ( ∫ ( n_eff / c_ref ) d ell );一致性比较必须在同一 gamma(ell) 与 d ell 下进行。

IV. 数据与清单口径


V. 算法与实现绑定

  1. 推荐原型与职责:
    • I40-8 align_timebase(trace:any, reference:any) -> {alpha:float, beta:float, fit:dict}:拟合与验证 ts ↔ tau_mono。
    • I40-10 compare_offline_online(off:any, on:any, policy:dict) -> ConsistencyReport:对齐窗口与时基,计算 delta_feat、delta_offon、err_decision、delta_psd 与通过判定。
    • I40-7 monitor_drift(stream:any, spec:dict) -> DriftReport:若漂移告警则暂停一致性结论并转入回退路径。
    • I40-4 score_predictions(y_true:any, y_pred:any, metrics:dict) -> ScoreReport:一致性与精度联合报告。
    • I40-23 rebuild_feature_window(log:any, window:dict) -> batch:依据 anchor 与 window 复刻离线窗口。
    • I40-24 reconcile_dedup(stream:any, policy:dict) -> stream:统一去重与迟到处理。
  2. ConsistencyReport 最小字段:
    delta_feat,delta_offon,R_infer,err_decision,delta_psd,alpha,beta,fit,coverage(有效样本比例),policy(门限),pass(bool),notes。

VI. 计量流程与运行图


VII. 验证与测试矩阵

  1. 最小必测用例:
    • 时基对齐回归:在多段 trace 上拟合 alpha,beta,要求 fit.R2 >= r2_min。
    • 窗口复刻正确性:构造含迟到与重复事件的数据,验证 I40-23 与 I40-24 的一致口径。
    • 特征一致性:标准化、离散化、时间平滑、缺失填充四类典型特征的 delta_feat 门限。
    • 输出一致性:回归与分类双工况分别校核 delta_offon 与 err_decision。
    • 谱一致性:对时序输出计算 delta_psd 并发布 U_w 与 ENBW。
    • 非确定源屏蔽:验证禁用 rng 与 atomic* 后 delta_offon 显著下降至门内。
    • 异常传播:nan/inf、极端值与空窗口的处理策略一致性。
  2. 边界与极端场景:
    大量迟到 lateness >> lateness_max,乱序与批量补写;高峰期资源抖动导致 TS.latency 飙升;量化切换与核算法切换引发的突变。

VIII. 交叉引用与依赖

与第3章之 P41-2、S42-16 的谱与时基口径一致;与第4章之特征接口和追溯字段一致;与第5章的数值与量化口径、确定性策略一致;与第8章的 TS.* 与 SLO 门联合验收;复现层面依赖《EFT.WP.Methods.Repro》第6章与第9章之时间与运行审计。

IX. 风险、限制与开放问题


X. 交付件与版本管理

  1. 交付件:
    • ConsistencyReport.json(含 delta_feat, delta_offon, R_infer, err_decision, delta_psd, alpha, beta, fit, coverage, pass),
    • AlignTimebaseReport.md,
    • WindowRebuildLog 与 DedupPolicy.yaml,
    • 对应的 ModelCard、PipelineCard 与 EnvLock 指纹快照。
  2. 版本策略:
    任何改变 window、去重策略、迟到阈值、dtype_policy、quant_scheme、内核版本或算子融合规则的改动,必须提升次版本,重走 Mx-54 → Mx-58,并在附录C登记 CHANGELOG 与 fingerprint = hash( policy || window || kernels || quant )。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/