目录 / 文档-技术白皮书 / 14-EFT.WP.Methods.Inference v1.0
I. 范围与目标
- 定义并落实离线批推理 offline 与线上实时推理 online 的一致性目标、计量方法与通过门,覆盖时基对齐、窗口复刻、特征一致性、模型数值口径与系统运行差异的屏蔽策略。
- 目标产出:
- 一致性度量与门限:delta_offon,R_infer = 1 - delta_offon,tau_offon;
- 特征一致性与窗口复刻口径:delta_feat,window = {context, history, lookahead=0};
- 时基对齐参数:alpha,beta 与拟合报告 fit;
- 运行剧本与验收流:Mx-54 → Mx-58 的可执行步骤与回退条件。
- 适用读者:数据与特征工程、模型研发、推理与调度平台、SRE 与合规团队。
II. 术语与符号
- 结果与一致性:
- y_hat_off(离线输出),y_hat_on(在线输出),delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) ),R_infer = 1 - delta_offon。
- 决策一致性:err_decision = ( 1 / N ) * Σ 1[ argmax( y_hat_off ) != argmax( y_hat_on ) ]。
- 时基与窗口:
- tau_mono(单调时基),ts(对外时标),ts = alpha + beta * tau_mono。
- 事件时与处理时:t_ev,t_proc;水位 watermark;迟到阈值 lateness_max。
- 窗口复刻 window = {context, history, lookahead=0};重放锚点 anchor。
- 特征与追溯:
- 特征向量 phi(x,t);特征一致性 delta_feat = ( norm( phi_off - phi_on ) / norm( phi_off ) )。
- 版本与签名:hash(·),fingerprint,EnvLock,ModelCard,PipelineCard。
- 谱与时域校核:
S_xx(f)(功率谱密度),谱一致性差异 delta_psd,窗口函数 U_w 与 ENBW。 - 并发与可观测性:
TS.latency,TS.thrpt,TS.error,hb(happens-before)。
III. 公设与最小方程
- P41-2 时基对齐公设
对任意轨迹 trace 与参考 reference,经映射 ts = alpha + beta * tau_mono 后进行比对;跨设备与跨域一致性必须在共同时基上定义与验收。 - P41-9 窗口复刻公设
在固定 window 与相同去重规则、迟到策略及 EnvLock 下,对同一 anchor 的数据切片,离线与在线的特征生成满足 delta_feat <= tau_feat。 - P41-10 推理等价公设(无漂移区间)
当输入分布无显著漂移且模型图、量化与数值口径与 ModelCard 一致时,delta_offon <= tau_offon 且 err_decision <= tau_decision。 - S42-14 一致性度量(向量/标量统一口径)
数据集 D = { x_i } 上:delta_offon(D) = ( norm( Y_off - Y_on ) / norm( Y_off ) ),其中 Y_* = concat_i y_hat_*(x_i)。 - S42-15 概率分布一致性
若输出为分布 p_off(y|x) 与 p_on(y|x),可并行报告 D_KL = ( 1 / N ) * Σ KL( p_off || p_on ) 与分桶 ECE_off-on。 - S42-16 谱一致性
对时间序列输出 z(t),delta_psd = ( ∫ | S_zz_off(f) - S_zz_on(f) | df ) / ( ∫ S_zz_off(f) df ),窗口与测度须声明 U_w 与 ENBW。 - S42-17 到达时窗口一致性
- 若涉及到达时 T_arr,应并行计算两口径并记录差异 delta_form:
- 常量外提:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell );一般口径:T_arr = ( ∫ ( n_eff / c_ref ) d ell );一致性比较必须在同一 gamma(ell) 与 d ell 下进行。
IV. 数据与清单口径
- 观测与比对最小字段:
request_id,anchor,model.version,ModelCard.fingerprint,PipelineCard.fingerprint,EnvLock,ts,tau_mono,t_ev,t_proc,watermark,lateness,dedup_key,feature_fingerprint,rng.seed,rng_family,dtype_policy,quant_scheme,inputs.hash,y_hat_off,y_hat_on。 - 迟到与去重口径:
去重以 dedup_key 与 hb 保序;lateness > lateness_max 的记录标注并排除一致性统计或单列分析。 - 单位与量纲:
ts 统一 UTC 或指定时区;TS.latency 以毫秒计;所有正态化指标无量纲,发布前执行 check_dim(expr)。
V. 算法与实现绑定
- 推荐原型与职责:
- I40-8 align_timebase(trace:any, reference:any) -> {alpha:float, beta:float, fit:dict}:拟合与验证 ts ↔ tau_mono。
- I40-10 compare_offline_online(off:any, on:any, policy:dict) -> ConsistencyReport:对齐窗口与时基,计算 delta_feat、delta_offon、err_decision、delta_psd 与通过判定。
- I40-7 monitor_drift(stream:any, spec:dict) -> DriftReport:若漂移告警则暂停一致性结论并转入回退路径。
- I40-4 score_predictions(y_true:any, y_pred:any, metrics:dict) -> ScoreReport:一致性与精度联合报告。
- I40-23 rebuild_feature_window(log:any, window:dict) -> batch:依据 anchor 与 window 复刻离线窗口。
- I40-24 reconcile_dedup(stream:any, policy:dict) -> stream:统一去重与迟到处理。
- ConsistencyReport 最小字段:
delta_feat,delta_offon,R_infer,err_decision,delta_psd,alpha,beta,fit,coverage(有效样本比例),policy(门限),pass(bool),notes。
VI. 计量流程与运行图
- Mx-54 对齐准备
固定 EnvLock 与 ModelCard,拉取 off/on 日志;统一 tz,检查缺失与异常值策略,记录 coverage。 - Mx-55 时基拟合与窗口复刻
调用 I40-8 得到 alpha,beta,fit;以 I40-23 复刻离线窗口;对齐 watermark 与 lateness_max,对超界样本单列。 - Mx-56 特征一致性检查
逐层对比特征 phi_off 与 phi_on,计算并发布 delta_feat;超过 tau_feat 则阻断后续发布并进入回退。 - Mx-57 输出一致性与谱校核
计算 delta_offon、err_decision、delta_psd;并行生成可靠性图与 ECE_off-on。 - Mx-58 验收与回退
判定条件:delta_offon <= tau_offon,err_decision <= tau_decision,delta_psd <= tau_psd,且 fit.R2 >= r2_min;不满足则回退至上一稳定通道并创建工单。
VII. 验证与测试矩阵
- 最小必测用例:
- 时基对齐回归:在多段 trace 上拟合 alpha,beta,要求 fit.R2 >= r2_min。
- 窗口复刻正确性:构造含迟到与重复事件的数据,验证 I40-23 与 I40-24 的一致口径。
- 特征一致性:标准化、离散化、时间平滑、缺失填充四类典型特征的 delta_feat 门限。
- 输出一致性:回归与分类双工况分别校核 delta_offon 与 err_decision。
- 谱一致性:对时序输出计算 delta_psd 并发布 U_w 与 ENBW。
- 非确定源屏蔽:验证禁用 rng 与 atomic* 后 delta_offon 显著下降至门内。
- 异常传播:nan/inf、极端值与空窗口的处理策略一致性。
- 边界与极端场景:
大量迟到 lateness >> lateness_max,乱序与批量补写;高峰期资源抖动导致 TS.latency 飙升;量化切换与核算法切换引发的突变。
VIII. 交叉引用与依赖
与第3章之 P41-2、S42-16 的谱与时基口径一致;与第4章之特征接口和追溯字段一致;与第5章的数值与量化口径、确定性策略一致;与第8章的 TS.* 与 SLO 门联合验收;复现层面依赖《EFT.WP.Methods.Repro》第6章与第9章之时间与运行审计。IX. 风险、限制与开放问题
- 数据回填与重放可能改变 watermark 与 lateness 分布,导致离线窗口与线上窗口天然不可比;须在报告中单列与剔除。
- 编译器或运行时的隐式算子改写、量化漂移与 fast_math 行为差异会放大 delta_offon;必须以 ModelCard.kernel_rev 与 dtype_policy 锁定。
- 分布漂移导致一致性通过但精度下降;一致性不能替代精度与校准验收,需联合 ScoreReport 与漂移报告判定。
- 多租户资源争用引入时间相关偏差;需要结合 TS.* 进行条件化评估。
X. 交付件与版本管理
- 交付件:
- ConsistencyReport.json(含 delta_feat, delta_offon, R_infer, err_decision, delta_psd, alpha, beta, fit, coverage, pass),
- AlignTimebaseReport.md,
- WindowRebuildLog 与 DedupPolicy.yaml,
- 对应的 ModelCard、PipelineCard 与 EnvLock 指纹快照。
- 版本策略:
任何改变 window、去重策略、迟到阈值、dtype_policy、quant_scheme、内核版本或算子融合规则的改动,必须提升次版本,重走 Mx-54 → Mx-58,并在附录C登记 CHANGELOG 与 fingerprint = hash( policy || window || kernels || quant )。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/