14-EFT.WP.Methods.Inference v1.0 | 第3章推理原理与公设

目录／文档-技术白皮书（V5.05）／ 14-EFT.WP.Methods.Inference v1.0

第3章推理原理与公设

I. 范围与目标

确立推理域的基础公设 P41-* 与最小方程 S42-*，覆盖风险最小化、校准一致、时基对齐与线下/线上等价性；为第6章在线/离线一致、第7章校准与不确定性、第12章验收评分提供可验证依据。
目标产出：
- 可引用的公设与方程编号锚点；
- 与 EnvLock、Graph(theta)、TS.* 对齐的计量流程 Mx-4*；
- 通过门 gate.inf 的数学口径与建议阈值字段。
通过标准：
- 任一表达含除号或积分均以括号围定并声明路径 gamma(ell) 与测度 d ell；
- 线下/线上对照先映射到共同时基 ts = alpha + beta * tau_mono；
- 校准度量给出分桶边界、加权方式与样本数。

II. 术语与符号

概率与风险：p(y | x, theta)，p(theta | D)，y_hat，L(y, y_hat)，R_emp，R_exp，NLL。
校准与不确定性：ECE，MCE，mean，var，quantile(q)，interval(1 - delta)。
一致性：delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) )，R_infer = 1 - delta_offon。
时基：tau_mono，ts，alpha，beta，window = [t0, t1]。
谱与能量：S_xx(f)，U_w，ENBW，var( x ) ≈ ( ∫ S_xx(f) df )。
环境与绑定：EnvLock，Graph(theta)，hash(·)，fingerprint，anchor，TS.latency/TS.thrpt/TS.error。

III. 公设与最小方程

P41-1 等价推理公设（固定图与环境）
在固定 Graph(theta) 与 EnvLock 条件下，给定同一 anchor、同一 seed、nondet_guard = true，对任意输入 x，有 run_inference_off(x) = run_inference_on(x)；若 nondet_guard = false 且保持 rng_family/seed 一致，则 p_off( y_hat | x ) = p_on( y_hat | x )。
P41-2 时基对齐公设
线下回放与线上实时必须满足 ts = alpha + beta * tau_mono；任何跨设备/跨域比较先映射到共同时基后再进行窗口对齐与评分。
P41-3 概率单调与守恒公设（校准映射）
校准映射 g(p) 必单调且保持事件排序：若 p_i >= p_j 则 g(p_i) >= g(p_j)；对分桶估计满足总量守恒 Σ_k w_k * g_bar_k = mean( p )，其中 w_k 为桶内权重。
S42-1 风险最小化与偏差-方差分解（平方损失口径）
- 经验风险：R_emp = ( 1 / N ) * Σ_{i=1..N} L( y_i, y_hat_i )。
- 正则化 ERM：theta_star = argmin_theta ( R_emp + lambda * Omega(theta) )。
- 误差分解：E[ ( y_hat - y )^2 ] = ( bias )^2 + variance + sigma_eps2，其中 sigma_eps2 为不可约噪声。
S42-2 概率校准最小方程（ECE/MCE/NLL）
- ECE = Σ_{k=1..K} w_k * | acc_k - conf_k |，MCE = max_k | acc_k - conf_k |；NLL = - ( 1 / N ) * Σ log p_theta( y_i | x_i )。
- 分桶需声明边界 {b_0,...,b_K} 与权重 w_k = n_k / N。
S42-3 线下/线上一致性方程
- delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) )，R_infer = 1 - delta_offon；门限示例：delta_offon <= tau_offon。
- 时序任务应并报谱一致性：delta_psd = ( ∫ | S_xx_off(f) - S_xx_on(f) | df ) / ( ∫ S_xx_off(f) df )，并注明窗口 U_w 与 ENBW。
S42-4 到达时两口径与路径声明（跨卷继承）
T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell ) 与 T_arr = ( ∫ ( n_eff / c_ref ) d ell ) 并行计算，报告差异 delta_form 并注明 gamma(ell) 与 d ell。

IV. 数据与清单口径

训练/评测数据分布声明：p_train(x,y)，p_eval(x,y)，若存在域偏移，需给出 shift = D( p_train || p_eval ) 的度量与解释。
校准数据最小字段：{id, ts, y, y_hat, conf, bin_index, weight}；分桶配置 {K, {b_k}} 入湖并版本化。
一致性对照清单：
匹配键 match_key = {id or (ts, source, window)}；对齐参数 {alpha, beta}；窗口容差 window_tol；范数定义与单位 norm(·)。

V. 算法与实现绑定

绑定原型（节选）：
- I40-4 score_predictions(y_true:any, y_pred:any, metrics:dict) -> ScoreReport
- I40-5 calibrate(runtime:Runtime, method:str, data:any) -> CalibReport
- I40-7 monitor_drift(stream:any, spec:dict) -> DriftReport
- I40-10 compare_offline_online(off:any, on:any, policy:dict) -> ConsistencyReport
伪流程（摘要）：
- 风险最小化：theta_star ← argmin ( R_emp + lambda*Omega )；输出 BiasVarReport。
- 概率校准：q ← g(p)，优化 ECE 或 NLL；产出 CalibReport 与 g 的参数。
- 线下/线上对照：对齐 ts 后计算 delta_offon 与 delta_psd，生成 ConsistencyReport。

VI. 计量流程与运行图

Mx-41 构建与锁定：冻结 EnvLock、加载 Graph(theta)、固化 ParamCard 与 alpha,beta。
Mx-42 风险与校准：评测 R_emp/R_exp、分解偏差-方差、执行校准并输出 CalibReport 与 ECE/NLL。
Mx-43 线下/线上一致性：回放线上窗口，计算 delta_offon 与 delta_psd；若超阈则进入回退剧本。
Mx-44 门限合成与发布：汇总 acc/ECE/NLL/TS.*/delta_offon，评估 gate.inf，产出验收结论。

VII. 验证与测试矩阵

最小用例：
- 确定性用例：nondet_guard = true，同一 seed 重跑，断言 y_hat 一致（检验 P41-1）。
- 时基对齐：随机采样窗口，验证 ts = alpha + beta * tau_mono 后 delta_offon 达到门限（检验 P41-2）。
- 校准一致：在 K 不同分桶方案下比较 ECE 稳健性（检验 P41-3 与 S42-2）。
- 谱一致性：对时序任务验证 var( x ) ≈ ( ∫ S_xx(f) df ) 与 delta_psd 门限（检验 S42-2 扩展）。
- 量化切换：fp32 → int8 同等性，记录 accuracy_drop 与 delta_offon。
边界与极端：
极低置信样本、长尾类别、缺失特征、动态批尺寸、设备热降频导致的 TS.latency_p95 抬升。

VIII. 交叉引用与依赖

与《Core.Metrology》：谱口径 S_xx(f)、窗口 U_w/ENBW、误差度量聚合。
与《Core.Threads》：并发语义与 TS.* 指标；限流与批调度对推理数值路径的影响口径。
与《EFT.WP.Methods.Repro》第3章：delta_rep 的复现口径与本章 delta_offon 的映射关系；环境锁定与签名继承。

IX. 风险、限制与开放问题

非确定性源的不可完全屏蔽：并行归约、GPU 原子序、库内部随机化；需记录 rng_family/seed 并在 gate.inf 前置护栏。
校准外推风险：g(p) 在分布外区域的行为不受保证；建议增设保守截断 p ∈ [eps, 1-eps]。
域偏移与概念漂移：p_train ≠ p_eval 可导致 ECE 虚高或 NLL 失真；应结合漂移报告与再校准策略。
量化与精度切换的非线性放大：对某些算子族 delta_offon 对应的 accuracy_drop 非单调；需分算子回归测试。

X. 交付件与版本管理

交付件：
- Postulates.md：本章 P41-*、S42-* 的最终文本与变更指纹；
- CalibReport 与 ConsistencyReport（含 {K,{b_k},ECE,MCE,NLL,delta_offon,delta_psd}）；
- BiasVarReport（含 bias^2/variance/sigma_eps2）；
- gate.inf 配置（tau_offon,tau_ece,tau_lat,...）与签名 fingerprint。
版本策略：
- 任一改变 Graph(theta)、EnvLock、K/{b_k} 或 alpha,beta，均提升次版本并触发 Mx-43 全量回归；
- 仅更新报告或可视化不触发重新校准，但需滚动 fingerprint 与变更记录（见附录C）。

版权与许可：除另有说明外，《能量丝理论》（含文本、图表、插图、符号与公式）的著作权由作者（屠广林）享有。
许可方式（CC BY 4.0）：在注明作者与来源的前提下，允许复制、转载、节选、改编与再分发。
署名格式（建议）：作者：屠广林｜作品：《能量丝理论》｜来源：energyfilament.org｜许可证：CC BY 4.0
验证召集： 作者独立自费、无雇主无资助；下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地，不限国家。欢迎各国媒体与同行抓住窗口组织验证，并与我们联系。
版本信息： 首次发布：2025-11-11 ｜当前版本：v6.0+5.05