目录文档-技术白皮书(V5.05)14-EFT.WP.Methods.Inference v1.0

第2章 术语、边界与对象模型


I. 范围与目标

  1. 定义推理域的统一术语与符号;确立 Env/Data/Model/Runtime/Metrics 五层对象模型与边界契约,确保跨团队、跨站点与跨设备交流无歧义。
  2. 目标产出:术语清单、冲突名与口径约束、对象模型与接口边界、跨卷字段映射方案、最小异常枚举与度量锚点;与第1章的 gate.inf、第3章 P41-*、S42-* 保持一致。
  3. 通过标准:
    • 所有接口入参与出参均以英文与纯文本表达,内联量一律反引号包裹。
    • 任意含除号或积分表达均加括号并声明路径 gamma(ell) 与测度 d ell。
    • 跨环境/跨设备对照前,统一映射到共同时基 ts = alpha + beta * tau_mono。

II. 术语与符号

  1. 基本量与概率:
    • x(输入),y(目标),theta(模型参数),y_hat(预测),p(y | x, theta)(似然),p(theta | D)(后验)。
    • 损失与风险:L(y, y_hat),R_emp = ( 1/N ) * Σ L( y_i, y_hat_i ),R_exp = E_{p(x,y)}[ L( y, y_hat ) ]。
  2. 时基与窗口:
    tau_mono(单调时基),ts(对外时间),alpha,beta(对齐系数),window = [t0, t1],lookahead = 0(线上约束)。
  3. 环境与追溯:
    EnvLock(环境锁定指纹),hash(·)(内容哈希),fingerprint(产物指纹),anchor(加载锚点)。
  4. 一致性与校准:
    delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) ),R_infer = 1 - delta_offon,ECE,MCE,NLL。
  5. 可观测与资源:
    TS.latency,TS.thrpt,TS.error,budget.cpu/gpu/mem,budget.power。
  6. 冲突名强制(跨卷通用):
    • T_fil 仅指张力;T_trans 仅指透射系数;n 为数密度,n_eff 为有效折射率;严禁混用。
    • 到达时两口径沿用:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell ) 与 T_arr = ( ∫ ( n_eff / c_ref ) d ell )。

III. 对象模型总览

  1. 五层对象与主通道:
    • Env 层:EnvLock → 为推理图与运行时提供可重放与可验证的执行环境。
    • Data 层:Dataset/Stream → 统一窗口与口径,输出标准化特征 features(x)。
    • Model 层:Graph(theta) → 以确定性优先的算子族与量化策略。
    • Runtime 层:Runtime → 负载编排、并发与批处理、设备与精度管理。
    • Metrics 层:MetricsBus → 统一采集 accuracy/ECE/NLL 与 TS.* 指标,输出 BenchReport、ConsistencyReport。
  2. 关键边与函数(与 I40-* 绑定):
    • build_inference_graph(I40-1),load_artifacts(I40-2),run_inference(I40-3),compare_offline_online(I40-10)。
    • 校准与漂移:calibrate(I40-5),monitor_drift(I40-7)。

IV. Env 层:环境域与锁定

  1. 组成字段(最小必需):
    • OS/Kernel/LibC/Compiler/BLAS/FFT;驱动与固件;cuda/cudnn 或同类加速栈;device{model,sm,driver}。
    • 浮点环境与 FPU 标志;量化配置 qformat(如 fp16, int8);随机源 rng_family 与 seed。
    • 时区与时基映射系数 {alpha, beta};线程与并发策略 TS.policy。
  2. 契约与异常:
    • 相同 EnvLock 下,I40-3 对同一 anchor/x/seed 幂等;漂移触发 E_ENV_DRIFT。
    • 任何跨站对照先执行 align_timebase,否则判为 E_TIMEBASE_SKEW。

V. Data 层:输入、特征与窗口

  1. 最小清单与口径:
    • 输入记录:{id, ts, source, window=[t0,t1], features, hash(features)}。
    • 特征加工需通过 check_dim(expr);标准化与缺失填补策略在 ParamCard 中固化。
  2. 窗口与流式约束:
    线上 lookahead = 0;离线回放须复刻生产窗口 window 与相同对齐函数 ts = alpha + beta * tau_mono。
  3. 追溯与脱敏:
    数据湖条目通过 hash(·) 与 fingerprint 串接;脱敏字段在 DataSpec 中显式标注。

VI. Model 层:算子与图


VII. Runtime 层:执行与并发


VIII. Metrics 层:度量与告警

  1. 线下评测:
    输出 BenchReport:acc,R_emp,ECE,NLL,资源占用与影子 TS.*。
  2. 线上一致性与漂移:
    • 输出 ConsistencyReport:delta_offon,R_infer = 1 - delta_offon,触发策略 delta_offon <= tau_offon。
    • 漂移监测以分布比较或谱口径进行;对序列任务检查 var( x ) ≈ ( ∫ S_xx(f) df ) 并公布 delta_psd 与窗口 U_w/ENBW。
  3. 告警矩阵:
    校准劣化 ECE > tau_ece;延迟越线 TS.latency_p95 > tau_lat;错误率越线 TS.error > tau_err;分别映射到降级或回退路径。

IX. 边界与接口契约

  1. 边界定义:
    • Env↔Model:I40-1/2 只读依赖 EnvLock,禁止运行期篡改。
    • Data↔Runtime:输入必须携带 {ts, window};Runtime 负责 align_timebase。
    • Model↔Runtime:设备与精度由 Runtime 决策,但不得破坏 Graph(theta) 的确定性约束。
    • Runtime↔Metrics:指标采集异步但一致性报告需要与推理结果同批对齐。
  2. 关键接口最小入参:
    • I40-1 build_inference_graph(spec:dict):需含 opset_version,precision_policy。
    • I40-3 run_inference(rt, inputs, opts):inputs 含 {features, ts, window};opts 可含 {seed, nondet_guard:true, batch:int}。
    • I40-10 compare_offline_online(off, on, policy):policy 含 match_key, window_tolerance, thresholds。
  3. 异常枚举(最小集):
    E_MODEL_MISMATCH,E_SCHEMA_MISMATCH,E_TIMEBASE_SKEW,E_NONDETERMINISM,E_CALIBRATION_FAIL,E_DRIFT_DETECTED,E_RESOURCE_EXCEEDED,E_PRECISION_LOSS。

X. 跨卷字段映射与口径继承


XI. 风险、限制与开放问题


XII. 编号锚点与记忆


版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05