目录 / 文档-技术白皮书 / 14-EFT.WP.Methods.Inference v1.0
I. 范围与目标
- 定义推理域的统一术语与符号;确立 Env/Data/Model/Runtime/Metrics 五层对象模型与边界契约,确保跨团队、跨站点与跨设备交流无歧义。
- 目标产出:术语清单、冲突名与口径约束、对象模型与接口边界、跨卷字段映射方案、最小异常枚举与度量锚点;与第1章的 gate.inf、第3章 P41-*、S42-* 保持一致。
- 通过标准:
- 所有接口入参与出参均以英文与纯文本表达,内联量一律反引号包裹。
- 任意含除号或积分表达均加括号并声明路径 gamma(ell) 与测度 d ell。
- 跨环境/跨设备对照前,统一映射到共同时基 ts = alpha + beta * tau_mono。
II. 术语与符号
- 基本量与概率:
- x(输入),y(目标),theta(模型参数),y_hat(预测),p(y | x, theta)(似然),p(theta | D)(后验)。
- 损失与风险:L(y, y_hat),R_emp = ( 1/N ) * Σ L( y_i, y_hat_i ),R_exp = E_{p(x,y)}[ L( y, y_hat ) ]。
- 时基与窗口:
tau_mono(单调时基),ts(对外时间),alpha,beta(对齐系数),window = [t0, t1],lookahead = 0(线上约束)。 - 环境与追溯:
EnvLock(环境锁定指纹),hash(·)(内容哈希),fingerprint(产物指纹),anchor(加载锚点)。 - 一致性与校准:
delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) ),R_infer = 1 - delta_offon,ECE,MCE,NLL。 - 可观测与资源:
TS.latency,TS.thrpt,TS.error,budget.cpu/gpu/mem,budget.power。 - 冲突名强制(跨卷通用):
- T_fil 仅指张力;T_trans 仅指透射系数;n 为数密度,n_eff 为有效折射率;严禁混用。
- 到达时两口径沿用:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell ) 与 T_arr = ( ∫ ( n_eff / c_ref ) d ell )。
III. 对象模型总览
- 五层对象与主通道:
- Env 层:EnvLock → 为推理图与运行时提供可重放与可验证的执行环境。
- Data 层:Dataset/Stream → 统一窗口与口径,输出标准化特征 features(x)。
- Model 层:Graph(theta) → 以确定性优先的算子族与量化策略。
- Runtime 层:Runtime → 负载编排、并发与批处理、设备与精度管理。
- Metrics 层:MetricsBus → 统一采集 accuracy/ECE/NLL 与 TS.* 指标,输出 BenchReport、ConsistencyReport。
- 关键边与函数(与 I40-* 绑定):
- build_inference_graph(I40-1),load_artifacts(I40-2),run_inference(I40-3),compare_offline_online(I40-10)。
- 校准与漂移:calibrate(I40-5),monitor_drift(I40-7)。
IV. Env 层:环境域与锁定
- 组成字段(最小必需):
- OS/Kernel/LibC/Compiler/BLAS/FFT;驱动与固件;cuda/cudnn 或同类加速栈;device{model,sm,driver}。
- 浮点环境与 FPU 标志;量化配置 qformat(如 fp16, int8);随机源 rng_family 与 seed。
- 时区与时基映射系数 {alpha, beta};线程与并发策略 TS.policy。
- 契约与异常:
- 相同 EnvLock 下,I40-3 对同一 anchor/x/seed 幂等;漂移触发 E_ENV_DRIFT。
- 任何跨站对照先执行 align_timebase,否则判为 E_TIMEBASE_SKEW。
V. Data 层:输入、特征与窗口
- 最小清单与口径:
- 输入记录:{id, ts, source, window=[t0,t1], features, hash(features)}。
- 特征加工需通过 check_dim(expr);标准化与缺失填补策略在 ParamCard 中固化。
- 窗口与流式约束:
线上 lookahead = 0;离线回放须复刻生产窗口 window 与相同对齐函数 ts = alpha + beta * tau_mono。 - 追溯与脱敏:
数据湖条目通过 hash(·) 与 fingerprint 串接;脱敏字段在 DataSpec 中显式标注。
VI. Model 层:算子与图
- 模型定义:
Graph(theta):包含算子集合、拓扑、精度策略与动态轴规范;opset_version 与设备可用性矩阵是发布前置门。 - 数值与确定性:
约束溢出/下溢与条件数;非确定性算子须声明屏蔽路径或替代实现;若无法屏蔽,运行需标注 E_NONDETERMINISM 并退出 gate.inf。 - 量化与兼容:
精度切换策略 fp32/fp16/int8 必附 accuracy_drop 评估与容忍窗口;跨设备需做同等性检验。
VII. Runtime 层:执行与并发
- 组成:
Runtime = {scheduler, batcher, device_pool, memory_manager, logger, metrics_sink}。 - 并发与可观测性:
线程语义与 TS.* 指标遵循《Core.Threads》;记录 TS.latency_p50/p95/p99,TS.thrpt,TS.error,TS.sla_violation。 - 幂等与副作用:
对同一 {EnvLock, anchor, seed, x},run_inference 无有害副作用;若需缓存,缓存键包含前述四元组。
VIII. Metrics 层:度量与告警
- 线下评测:
输出 BenchReport:acc,R_emp,ECE,NLL,资源占用与影子 TS.*。 - 线上一致性与漂移:
- 输出 ConsistencyReport:delta_offon,R_infer = 1 - delta_offon,触发策略 delta_offon <= tau_offon。
- 漂移监测以分布比较或谱口径进行;对序列任务检查 var( x ) ≈ ( ∫ S_xx(f) df ) 并公布 delta_psd 与窗口 U_w/ENBW。
- 告警矩阵:
校准劣化 ECE > tau_ece;延迟越线 TS.latency_p95 > tau_lat;错误率越线 TS.error > tau_err;分别映射到降级或回退路径。
IX. 边界与接口契约
- 边界定义:
- Env↔Model:I40-1/2 只读依赖 EnvLock,禁止运行期篡改。
- Data↔Runtime:输入必须携带 {ts, window};Runtime 负责 align_timebase。
- Model↔Runtime:设备与精度由 Runtime 决策,但不得破坏 Graph(theta) 的确定性约束。
- Runtime↔Metrics:指标采集异步但一致性报告需要与推理结果同批对齐。
- 关键接口最小入参:
- I40-1 build_inference_graph(spec:dict):需含 opset_version,precision_policy。
- I40-3 run_inference(rt, inputs, opts):inputs 含 {features, ts, window};opts 可含 {seed, nondet_guard:true, batch:int}。
- I40-10 compare_offline_online(off, on, policy):policy 含 match_key, window_tolerance, thresholds。
- 异常枚举(最小集):
E_MODEL_MISMATCH,E_SCHEMA_MISMATCH,E_TIMEBASE_SKEW,E_NONDETERMINISM,E_CALIBRATION_FAIL,E_DRIFT_DETECTED,E_RESOURCE_EXCEEDED,E_PRECISION_LOSS。
X. 跨卷字段映射与口径继承
- 与《EFT.WP.Methods.Repro》:
继承 EnvLock、hash(·)、fingerprint、TS.*、发布通道 canary/stable/LTS、验收与归档流程;一致性度量由 delta_offon 对应 delta_rep 的推理域版本。 - 与《Core.*》:
《Core.DataSpec》提供 DataRecord 与 FeatureSpec;《Core.Threads》提供 TS.* 字段与并发语义;《Core.Metrology》提供 S_xx(f)、U_w、ENBW 与谱一致性口径。 - 统一编号:
本卷公设 P41-*,最小方程 S42-*,计量流程 Mx-4*,实现绑定 I40-*;跨卷引用写作:“见 配套白皮书《能量丝》 第x章 S/P/M/I…”。
XI. 风险、限制与开放问题
- 非确定性源:GPU 原子序、并行归约、数据竞态;需以确定性路径替代或触发 E_NONDETERMINISM。
- 动态形状与批调度:batch 自适应可能改变数值路径;需在 BenchReport 中验证对 acc/ECE 的影响。
- 特征漂移与口径变更:训练-推理标准化与缺失策略一旦不一致,易触发 E_SCHEMA_MISMATCH 与 delta_offon 异常。
- 量化切换:fp32 → int8 的精度回退阈值与任务相关;建议在跨设备等级单列同等性检验。
XII. 编号锚点与记忆
- 公设引用:P41-1 等价推理,P41-2 时基对齐。
- 最小方程:S42-1 风险最小化,S42-2 校准一致性。
- 计量流程:Mx-41 构建锁定,Mx-42 离线评测,Mx-43 线上灰度,Mx-44 发布归档。
- 实现绑定:I40-1,I40-2,I40-3,I40-5,I40-7,I40-10。
- 关键度量与门:delta_offon,R_infer,ECE,NLL,TS.latency,TS.error,gate.inf。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/