目录文档-技术白皮书14-EFT.WP.Methods.Inference v1.0

第2章 术语、边界与对象模型


I. 范围与目标

  1. 定义推理域的统一术语与符号;确立 Env/Data/Model/Runtime/Metrics 五层对象模型与边界契约,确保跨团队、跨站点与跨设备交流无歧义。
  2. 目标产出:术语清单、冲突名与口径约束、对象模型与接口边界、跨卷字段映射方案、最小异常枚举与度量锚点;与第1章的 gate.inf、第3章 P41-*、S42-* 保持一致。
  3. 通过标准:
    • 所有接口入参与出参均以英文与纯文本表达,内联量一律反引号包裹。
    • 任意含除号或积分表达均加括号并声明路径 gamma(ell) 与测度 d ell。
    • 跨环境/跨设备对照前,统一映射到共同时基 ts = alpha + beta * tau_mono。

II. 术语与符号

  1. 基本量与概率:
    • x(输入),y(目标),theta(模型参数),y_hat(预测),p(y | x, theta)(似然),p(theta | D)(后验)。
    • 损失与风险:L(y, y_hat),R_emp = ( 1/N ) * Σ L( y_i, y_hat_i ),R_exp = E_{p(x,y)}[ L( y, y_hat ) ]。
  2. 时基与窗口:
    tau_mono(单调时基),ts(对外时间),alpha,beta(对齐系数),window = [t0, t1],lookahead = 0(线上约束)。
  3. 环境与追溯:
    EnvLock(环境锁定指纹),hash(·)(内容哈希),fingerprint(产物指纹),anchor(加载锚点)。
  4. 一致性与校准:
    delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) ),R_infer = 1 - delta_offon,ECE,MCE,NLL。
  5. 可观测与资源:
    TS.latency,TS.thrpt,TS.error,budget.cpu/gpu/mem,budget.power。
  6. 冲突名强制(跨卷通用):
    • T_fil 仅指张力;T_trans 仅指透射系数;n 为数密度,n_eff 为有效折射率;严禁混用。
    • 到达时两口径沿用:T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell ) 与 T_arr = ( ∫ ( n_eff / c_ref ) d ell )。

III. 对象模型总览

  1. 五层对象与主通道:
    • Env 层:EnvLock → 为推理图与运行时提供可重放与可验证的执行环境。
    • Data 层:Dataset/Stream → 统一窗口与口径,输出标准化特征 features(x)。
    • Model 层:Graph(theta) → 以确定性优先的算子族与量化策略。
    • Runtime 层:Runtime → 负载编排、并发与批处理、设备与精度管理。
    • Metrics 层:MetricsBus → 统一采集 accuracy/ECE/NLL 与 TS.* 指标,输出 BenchReport、ConsistencyReport。
  2. 关键边与函数(与 I40-* 绑定):
    • build_inference_graph(I40-1),load_artifacts(I40-2),run_inference(I40-3),compare_offline_online(I40-10)。
    • 校准与漂移:calibrate(I40-5),monitor_drift(I40-7)。

IV. Env 层:环境域与锁定

  1. 组成字段(最小必需):
    • OS/Kernel/LibC/Compiler/BLAS/FFT;驱动与固件;cuda/cudnn 或同类加速栈;device{model,sm,driver}。
    • 浮点环境与 FPU 标志;量化配置 qformat(如 fp16, int8);随机源 rng_family 与 seed。
    • 时区与时基映射系数 {alpha, beta};线程与并发策略 TS.policy。
  2. 契约与异常:
    • 相同 EnvLock 下,I40-3 对同一 anchor/x/seed 幂等;漂移触发 E_ENV_DRIFT。
    • 任何跨站对照先执行 align_timebase,否则判为 E_TIMEBASE_SKEW。

V. Data 层:输入、特征与窗口

  1. 最小清单与口径:
    • 输入记录:{id, ts, source, window=[t0,t1], features, hash(features)}。
    • 特征加工需通过 check_dim(expr);标准化与缺失填补策略在 ParamCard 中固化。
  2. 窗口与流式约束:
    线上 lookahead = 0;离线回放须复刻生产窗口 window 与相同对齐函数 ts = alpha + beta * tau_mono。
  3. 追溯与脱敏:
    数据湖条目通过 hash(·) 与 fingerprint 串接;脱敏字段在 DataSpec 中显式标注。

VI. Model 层:算子与图


VII. Runtime 层:执行与并发


VIII. Metrics 层:度量与告警

  1. 线下评测:
    输出 BenchReport:acc,R_emp,ECE,NLL,资源占用与影子 TS.*。
  2. 线上一致性与漂移:
    • 输出 ConsistencyReport:delta_offon,R_infer = 1 - delta_offon,触发策略 delta_offon <= tau_offon。
    • 漂移监测以分布比较或谱口径进行;对序列任务检查 var( x ) ≈ ( ∫ S_xx(f) df ) 并公布 delta_psd 与窗口 U_w/ENBW。
  3. 告警矩阵:
    校准劣化 ECE > tau_ece;延迟越线 TS.latency_p95 > tau_lat;错误率越线 TS.error > tau_err;分别映射到降级或回退路径。

IX. 边界与接口契约

  1. 边界定义:
    • Env↔Model:I40-1/2 只读依赖 EnvLock,禁止运行期篡改。
    • Data↔Runtime:输入必须携带 {ts, window};Runtime 负责 align_timebase。
    • Model↔Runtime:设备与精度由 Runtime 决策,但不得破坏 Graph(theta) 的确定性约束。
    • Runtime↔Metrics:指标采集异步但一致性报告需要与推理结果同批对齐。
  2. 关键接口最小入参:
    • I40-1 build_inference_graph(spec:dict):需含 opset_version,precision_policy。
    • I40-3 run_inference(rt, inputs, opts):inputs 含 {features, ts, window};opts 可含 {seed, nondet_guard:true, batch:int}。
    • I40-10 compare_offline_online(off, on, policy):policy 含 match_key, window_tolerance, thresholds。
  3. 异常枚举(最小集):
    E_MODEL_MISMATCH,E_SCHEMA_MISMATCH,E_TIMEBASE_SKEW,E_NONDETERMINISM,E_CALIBRATION_FAIL,E_DRIFT_DETECTED,E_RESOURCE_EXCEEDED,E_PRECISION_LOSS。

X. 跨卷字段映射与口径继承


XI. 风险、限制与开放问题


XII. 编号锚点与记忆


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/