目录 / 文档-技术白皮书 / 14-EFT.WP.Methods.Inference v1.0
I. 范围与目标
- 明确本卷“推理(Inference)”的对象域:以已训练参数 theta 与固定推理图 Graph(theta) 为中心,覆盖离线批推理、在线流式推理与边缘/中心混布的运行形态;不含训练与标注流程,但要求与训练-验证口径严格对齐。
- 面向读者:模型与平台工程师、计量与合规负责人、运维与发布负责人、第三方验证方。
- 产出物与通过标准:
- 产出物:InferPipelineCard、ParamCard、BenchReport、ConsistencyReport、CalibReport、ReleaseBundle。
- 通过标准(见本章“推理等级”):以 gate.inf 判定;核心度量含精度、校准、一致性与 SLO。示例综合门:
gate.inf: pass iff ( acc >= acc_min ) ∧ ( ECE <= tau_ece ) ∧ ( delta_offon <= tau_offon ) ∧ ( TS.latency_p95 <= tau_lat ) ∧ ( TS.error <= tau_err )。
II. 术语与符号
- 概率与风险:x,y,theta,y_hat,p(y | x, theta),p(theta),R_emp,R_exp,L(y, y_hat)。
- 校准与不确定性:ECE,MCE,NLL,mean,var,quantile(q)。
- 一致性与评分:delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) ),R_infer = 1 - delta_offon,score_inf。
- 运行与可观测性:TS.latency,TS.thrpt,TS.error,TS.sla_violation,budget.cpu/gpu/mem/power。
- 环境与追溯:EnvLock,hash(·),fingerprint,anchor,seed。
- 冲突名强制与复用口径:T_fil 仅指张力;T_trans 仅指透射系数;n 为数密度,n_eff 为有效折射率;含积分与除号的表达一律加括号并声明路径 gamma(ell) 与测度 d ell。到达时两口径沿用:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell ) 与 T_arr = ( ∫ ( n_eff / c_ref ) d ell )。
III. 公设与最小方程
- P41-1 等价推理公设(固定图与锁定环境)
y_hat_off ≈ y_hat_on,差异以 delta_offon 计量并受门限约束。在 EnvLock 与固定 Graph(theta) 下,对同一输入 x 与同一 seed,离线与在线推理经时基对齐后给出等价输出分布: - P41-2 时基对齐公设
推理时间映射 ts = alpha + beta * tau_mono,所有线上度量先映射至共同时基后再比较。 - S42-1 风险最小化与误差分解
R_emp = ( 1/N ) * Σ_{i=1..N} L( y_i, y_hat_i );R_exp = E_{p(x,y)}[ L( y, y_hat ) ];在推理阶段报告 R_emp 与相对漂移 delta_R = ( R_emp_new - R_emp_ref ) / R_emp_ref。 - S42-2 校准一致性
ECE = Σ_{b=1..B} ( n_b / N ) * | conf_b - acc_b |;需声明分桶法、B 与计量窗口。 - S42-3 一致性与综合评分
score_inf = w_acc * acc + w_cal * ( 1 - ECE ) + w_cons * R_infer + w_lat * ( 1 - norm_lat ) + w_err * ( 1 - TS.error ),权重 w_* 与归一化法随 BenchReport 发布。R_infer = 1 - delta_offon;综合评分示例:
IV. 数据与清单口径
- 输入/输出口径最小字段集:
- 输入:id,ts,features,source,window = [t0, t1],hash(features)。
- 输出:y_hat,uncertainty = {mean,var,quantile},ts_out,routing,fingerprint(Graph,theta)。
- 追溯与合规:
每次推理须落 Provenance:EnvLock,Graph(theta) 指纹,ParamCard 摘要,seed,rng_family,以及 hash(·) 链接数据湖条目。 - 特征一致性契约:
训练-推理需共享同一规范化算子与量纲校核 check_dim(expr);若发生替换,需在 ChangeLog 中标注兼容旗标与迁移窗口。
V. 算法与实现绑定
- I40-* 原型(本章锚定):
- I40-1 build_inference_graph(spec:dict) -> Graph
- I40-2 load_artifacts(anchor:str) -> Runtime
- I40-3 run_inference(rt:Runtime, inputs:any, opts:dict) -> outputs:any
- I40-10 compare_offline_online(off:any, on:any, policy:dict) -> ConsistencyReport
- 幂等与异常契约:
同一 EnvLock、anchor、seed 与输入集重复调用 I40-3 应幂等;若非确定性算子存在,需在 opts: { nondet_guard:true } 下启用确定性路径或报告 E_NONDETERMINISM。
VI. 计量流程与运行图
- Mx-41 构建与锁定
构建 Graph(theta) → 生成 EnvLock → 落 InferPipelineCard 与 ParamCard。 - Mx-42 离线评测
在基准集上产出 BenchReport:记录 acc,R_emp,ECE,资源占用与 TS.* 影子指标。 - Mx-43 线上灰度
canary 策略:并行双跑,计算 delta_offon,产出 ConsistencyReport,触发 gate.inf。 - Mx-44 发布与归档
通过门后签名发布,生成 ReleaseBundle,归档 fingerprint 与 ChangeLog 条目。
VII. 验证与测试矩阵
- 最小必测用例:
正常样本、边界样本(缺失、异常值、极端分布)、延迟峰值窗口、资源紧张窗口。 - 一致性与校准:
delta_offon <= tau_offon;ECE <= tau_ece;NLL <= tau_nll;所有阈值需声明置信度与计量窗口。 - SLO 与可用性:
TS.latency_p95 <= tau_lat;TS.error <= tau_err;出现违反触发降级与回退。 - 物理/谱一致性(如适用):
序列/信号类任务需检查 var( x ) ≈ ( ∫ S_xx(f) df ),并报告 delta_psd。
VIII. 交叉引用与依赖
- 口径与术语:见《Core.Terms》《Core.DataSpec》《Core.Metrology》。
- 并发与可观测性:见《Core.Threads》之 TS.* 字段。
- 复现与发布:见《EFT.WP.Methods.Repro》之第3章(公设)、第8章(评分)、第9章(运行与发布)、第12章(验收发布)、第13章(变更策略)。
IX. 风险、限制与开放问题
- 非确定性源:GPU 原子序、并行归约、随机化算子;需以确定性替代或报告 E_NONDETERMINISM。
- 分布漂移:线上 p(x) 与训练分布偏移;需持续 monitor_drift 并设告警阈值。
- 特征偏差与口径漂移:离线特征回放与在线实时流在窗口/缺失填补上的差异。
- 量化与精度切换:fp32/fp16/int8 的数值稳定性与饱和;需在跨设备等级中单独验证。
- 公平性与合规:若涉及人群属性,需单列敏感维度的误差与校准报告(度量仍使用英文符号)。
X. 交付件与版本管理
- 发布清单:
InferPipelineCard,ParamCard,BenchReport,ConsistencyReport,CalibReport,ReleaseBundle(含 fingerprint(Graph,theta,EnvLock) 与 hash(dataset))。 - 版本与通道:
canary/stable/LTS 三通道与语义化版本;每次变更进入 ChangeLog,记录 delta_spec、兼容旗标与迁移窗口。 - 验收门与归档:
以 gate.inf 为统一通过门;通过则生成长期可取证包,包含 EnvLock、anchor、seed、TS.* 摘要与签名链。
推理等级(Inference Levels)
- L0 Sanity 基线连通
目标:接口连通、形状与量纲正确。门:TS.error == 0,R_emp 可计算。 - L1 Offline Deterministic 离线确定性
目标:离线在 EnvLock 下稳定;门:acc >= acc_min,ECE <= tau_ece_off,资源预算达标。 - L2 Online Parity 线上等价
目标:离线-线上等价;门:delta_offon <= tau_offon,TS.latency_p95 <= tau_lat。 - L3 Cross-Site/Device 跨站/跨设备一致
目标:多站点与多硬件一致;门:各站点 delta_offon <= tau_offon_site,量化切换后 acc_drop <= tau_drop。 - L4 Regulated Traceable 合规可取证
目标:全链审计可验证、第三方复核可重放;门:产出完整 ReleaseBundle 与签名链,满足审计抽检与重放时基对齐 alpha, beta 的置信要求。
本章编号与记忆锚点
- 公设:P41-1,P41-2。
- 最小方程:S42-1,S42-2,S42-3。
- 计量流程:Mx-41,Mx-42,Mx-43,Mx-44。
- 实现绑定:I40-1,I40-2,I40-3,I40-10。
- 关键度量:delta_offon,R_infer,ECE,NLL,TS.latency,TS.error,score_inf,gate.inf。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/