目录 / 文档-技术白皮书 / 14-EFT.WP.Methods.Inference v1.0
I. 范围与目标
- 规范多站点(site)、多域(domain)与多硬件(device_class ∈ {CPU,GPU,ACC})下的推理一致性、偏差预算与同等性检验;确保在锁定环境 EnvLock 与统一时基下,预测、校准与 SLO 在可接受范围内可移植与可取证。
- 形成跨域/跨设备评估口径:差异度量、量化/精度迁移策略、运输与对照实验设计、异常处置与报告模板;对接第6章在线/离线一致性与第8章 SLO 合成。
II. 术语与符号
- domain, site:业务或地理域、部署站点;cohort:域内同质样本子集。
- device_class:CPU/GPU/ACC;dtype_policy ∈ {fp32,fp16,int8}。
- y_hat_A, y_hat_B:同一输入在设备/站点 A/B 上的预测;conf_A, conf_B 为对应置信度。
- 跨设备差异:delta_dev = ( norm( y_hat_A - y_hat_B ) / norm( y_hat_A ) ),R_infer_dev = 1 - delta_dev。
- 校准差异:Delta_ECE = ECE_B - ECE_A,Delta_NLL = NLL_B - NLL_A。
- 时基映射:ts_D = alpha_D + beta_D * tau_mono_D;跨域对齐先落共同时基 ts_ref。
- 偏差预算:budget.bias = budget.quant + budget.rng + budget.sched + budget.kernel + budget.sensor。
III. 公设与最小方程
- P41-71 跨设备等价公设(锁定环境)
在 EnvLock 与统一 IPC/PC 下,预测差异的主要来源是数值表示与执行调度:delta_dev ≈ f( dtype_policy, sched, kernel );其上界可被事前设定的偏差预算约束:delta_dev <= tau_dev. - P41-72 跨域稳健校准公设
对任一域 D,若训练域与部署域的分布偏移 shift(D) 有界,且校准映射为 1-Lipschitz,则 |Delta_ECE| <= L_calib * shift(D)。 - S42-71 量化与舍入误差上界
设模型在输入邻域 U 上 L-Lipschitz,量化步长为 q,则
norm( y_hat_fp32 - y_hat_int8 ) <= L * q * C_layers,
其中 C_layers 与层数及激活饱和度有关(常量外提)。 - S42-72 跨域风险分解(重要性加权)
R_exp^B = E_{p_B(x,y)}[ L( y, f(x) ) ] = E_{p_A(x,y)}[ w(x,y) * L( y, f(x) ) ],
w(x,y) = ( p_B(x,y) / p_A(x,y) );若 w 有界且 Var(w) 可控,则
R_exp^B <= R_exp^A + O( sqrt( Var(w) / N ) )。 - S42-73 校准迁移与温度缩放组合
conf_B = softmax( z_B / T_B ),T_B = argmin_T NLL_B(T);若 z_B = z_A + epsilon,|epsilon| <= eps_z,则 |Delta_NLL| <= C_T * eps_z。 - S42-74 谱口径的一致性检验
传感器/噪声差异以谱密度对接:var( n_D ) ≈ ∫ S_nn^D(f) df;若 | ∫ ( S_nn^A(f) - S_nn^B(f) ) df | <= eps_spec,则对低通稳定算子,delta_dev 的噪声份额上界为 k_spec * eps_spec(见《Core.Metrology》)。
IV. 数据与清单口径
- 统一事件字段增补(相对第10章):
- site, domain, device_class, device_id_hash, dtype_policy, driver/runtime_version。
- rng.seed, rng_family(若使用随机化算子)。
- quant_profile = {scale, zero_point, per_channel:boolean}。
- clock_align = {alpha_D, beta_D}。
- 采样与分层:
- 分层按 {site, device_class, dtype_policy} 与 cohort;每层设 N_min 与最大占比,避免单层主导。
- 高基数字段一律 hash(·) 或匿名化,遵从脱敏策略(见第4章)。
- 入湖与追溯:
建立 anchor → (IPC,PC) → Runtime → Event 链;全链 fingerprint 与 signature 必填。
V. 算法与实现绑定
- 原型
- I40-40 plan_cross_device_tests(matrix:dict) -> TestPlan
- I40-41 run_equivalence(plan:TestPlan) -> {delta_dev:float, Delta_ECE:float, Delta_NLL:float, report:any}
- I40-42 align_multisite_time(traces:any, ref:any) -> {alpha:dict, beta:dict, fit:dict}
- I40-43 estimate_quant_error(runtime:Runtime, x:any) -> {bound:float, profile:dict}
- I40-44 domain_shift_weight(pA:any, pB:any, method:str) -> w:any
- I40-45 transport_ab(off:any, on:any, policy:dict) -> TransportReport
- I40-46 compose_slo_multisite(slo_list:list, weights:dict) -> {slo_e2e:dict, gaps:dict}
- I40-47 certify_equivalence(report:any, policy:dict) -> CertEq
- 等价检验(摘要)
- 统一时基:ts_D → ts_ref(I40-42)。
- 同一 inputs、同一 anchor、同一 IPC/PC,在 {A,B} 上双跑。
- 计算 delta_dev, Delta_ECE, Delta_NLL 与分层分位差:Q_0.95( | y_hat_A - y_hat_B | )。
- 判定:meet = ( delta_dev <= tau_dev ) AND ( |Delta_ECE| <= tau_cal ) AND ( |Delta_NLL| <= tau_nll )。
- 产出 CertEq 与可复验脚本。
- 偏差预算分摊
- budget.quant(量化与舍入)、budget.rng(随机化算子)、budget.sched(并行/调度)、budget.kernel(实现差异)、budget.sensor(输入链路差异)。
- 采用加法保守合成:budget.bias = Σ budget.*;若来源独立,可用平方可加上界:budget.bias <= sqrt( Σ budget.*^2 )。
VI. 计量流程与运行图(Mx-71 → Mx-78)
- Mx-71 跨域基线对齐
收集各 site 样本与 clock_align 参数;执行 I40-42 生成 ts_ref 映射并回写 Runtime。 - Mx-72 运输与对照设计
I40-40 生成 TestPlan:分层采样、A/B 对照、干预因子仅限 {device_class, dtype_policy}。 - Mx-73 双跑与差异计算
执行 I40-41;输出 delta_dev、Delta_ECE、Delta_NLL、分层差异热图与尾部分位。 - Mx-74 量化误差剖析
运行 I40-43 获取层级敏感度与 bound;若 bound > tau_quant,建议回退 dtype_policy 或启用感知量化校正。 - Mx-75 域偏移与重加权
估计 w(x,y)(I40-44);重评 R_exp^B 与 ECE_B,生成漂移报告与再校准建议。 - Mx-76 SLO 端到端合成
I40-46 按权重 {traffic_share, risk_weight} 合成跨站点 SLO 与差距向量 gap。 - Mx-77 证书与异常处置
I40-47 生成 CertEq;若不达标,进入降级/回退:A/B 切回 stable,或执行 canary 比例下调(见第10章)。 - Mx-78 季度再认证
建立周期复验:更新 TestPlan、阈值与预算;归档 AuditLog 与 CertEq。
VII. 验证与测试矩阵
- 量化迁移:fp32 → int8 于 {CPU,GPU} 双跑,验证 delta_dev <= tau_dev,|Delta_ECE| <= tau_cal。
- 并行度扰动:固定 dtype_policy,改变线程与流数,检测 budget.sched 对尾延迟与 delta_dev 的影响。
- 随机化隔离:开启/关闭 dropout/MC 推理(若存在),验证 budget.rng 估计与重放幂等(记录 rng.seed、rng_family)。
- 传感器谱差:两站点输入经 S_xx(f) 估算 eps_spec,验证 k_spec * eps_spec 上界与实测 delta_dev 的吻合度。
- 域偏移再校准:用 w(x,y) 重加权评估 R_exp^B 与 ECE_B,检验 S42-72 的方差项估计。
- 端到端 SLO:多站点合成后,检查 slo_e2e 与单站 SLO 的一致性与最小值原则的保守性。
- 灰度与回退:canary 比例从 p 递增到 P,每阶验证 delta_dev 与事件率不劣化后再晋级。
VIII. 交叉引用与依赖
依第6章的 delta_offon 与时基对齐;第7章的 ECE/MCE/NLL 校准口径;第8章的 SLO 目标与权重;第9章 IPC/PC 字段与变更剧本;第10章告警与回退执行;《Core.Sea》《Core.Metrology》《Core.Errors》之时基、谱度量与错误枚举。IX. 风险、限制与开放问题
- 极端域偏移下,重要性加权的方差膨胀;需设 clip(w, w_max) 与稳健损失。
- 某些加速器的内核实现非严格逐点等价,budget.kernel 难以精准上界;建议引入参考核对照与合约测试。
- 量化后在稀疏区间的非线性放大可能破坏 1-Lipschitz 假设;需层级局部 Lipschitz 估计与门限自适应。
- 多域 SLO 权重选择带有业务主观性;建议保守原则:SLO.compose = min( SLO_site ) 并披露权重。
X. 交付件与版本管理
- 交付件
- CrossDomainTestPlan.yaml:Mx-72 生成的运输与对照方案。
- EquivalenceReport.md:delta_dev/Delta_ECE/Delta_NLL 与分层结果。
- QuantAnalysis.json:层级敏感度与误差上界。
- DomainShiftReport.md:w(x,y) 方法、稳定性与再校准建议。
- SLO-Multisite.yaml:合成策略与权重。
- CertEq.pdf:等价证书与有效期。
- AuditLog.csv:可追溯记录与签名。
- 版本策略
- 任一跨设备阈值(如 tau_dev, tau_cal)与权重调整,必须更新 PC.meta.parent_fingerprint 并重新出具 CertEq。
- TestPlan、报告与证书按 canary/stable/LTS 通道归档;证书到期前 Mx-78 自动触发复验。
- 任何核实现或 dtype_policy 变更须先通过 Mx-71 → Mx-77 全链路再放量。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/