14-EFT.WP.Methods.Inference v1.0 | 第11章跨域/跨设备推理

目录／文档-技术白皮书（V5.05）／ 14-EFT.WP.Methods.Inference v1.0

第11章跨域/跨设备推理

I. 范围与目标

规范多站点（site）、多域（domain）与多硬件（device_class ∈ {CPU,GPU,ACC}）下的推理一致性、偏差预算与同等性检验；确保在锁定环境 EnvLock 与统一时基下，预测、校准与 SLO 在可接受范围内可移植与可取证。
形成跨域/跨设备评估口径：差异度量、量化/精度迁移策略、运输与对照实验设计、异常处置与报告模板；对接第6章在线/离线一致性与第8章 SLO 合成。

II. 术语与符号

domain, site：业务或地理域、部署站点；cohort：域内同质样本子集。
device_class：CPU/GPU/ACC；dtype_policy ∈ {fp32,fp16,int8}。
y_hat_A, y_hat_B：同一输入在设备/站点 A/B 上的预测；conf_A, conf_B 为对应置信度。
跨设备差异：delta_dev = ( norm( y_hat_A - y_hat_B ) / norm( y_hat_A ) )，R_infer_dev = 1 - delta_dev。
校准差异：Delta_ECE = ECE_B - ECE_A，Delta_NLL = NLL_B - NLL_A。
时基映射：ts_D = alpha_D + beta_D * tau_mono_D；跨域对齐先落共同时基 ts_ref。
偏差预算：budget.bias = budget.quant + budget.rng + budget.sched + budget.kernel + budget.sensor。

III. 公设与最小方程

P41-71 跨设备等价公设（锁定环境）
在 EnvLock 与统一 IPC/PC 下，预测差异的主要来源是数值表示与执行调度：delta_dev ≈ f( dtype_policy, sched, kernel )；其上界可被事前设定的偏差预算约束：delta_dev <= tau_dev.
P41-72 跨域稳健校准公设
对任一域 D，若训练域与部署域的分布偏移 shift(D) 有界，且校准映射为 1-Lipschitz，则 |Delta_ECE| <= L_calib * shift(D)。
S42-71 量化与舍入误差上界
设模型在输入邻域 U 上 L-Lipschitz，量化步长为 q，则
norm( y_hat_fp32 - y_hat_int8 ) <= L * q * C_layers，
其中 C_layers 与层数及激活饱和度有关（常量外提）。
S42-72 跨域风险分解（重要性加权）
R_exp^B = E_{p_B(x,y)}[ L( y, f(x) ) ] = E_{p_A(x,y)}[ w(x,y) * L( y, f(x) ) ]，
w(x,y) = ( p_B(x,y) / p_A(x,y) )；若 w 有界且 Var(w) 可控，则
R_exp^B <= R_exp^A + O( sqrt( Var(w) / N ) )。
S42-73 校准迁移与温度缩放组合
conf_B = softmax( z_B / T_B )，T_B = argmin_T NLL_B(T)；若 z_B = z_A + epsilon，|epsilon| <= eps_z，则 |Delta_NLL| <= C_T * eps_z。
S42-74 谱口径的一致性检验
传感器/噪声差异以谱密度对接：var( n_D ) ≈ ∫ S_nn^D(f) df；若 | ∫ ( S_nn^A(f) - S_nn^B(f) ) df | <= eps_spec，则对低通稳定算子，delta_dev 的噪声份额上界为 k_spec * eps_spec（见《Core.Metrology》）。

IV. 数据与清单口径

统一事件字段增补（相对第10章）：
- site, domain, device_class, device_id_hash, dtype_policy, driver/runtime_version。
- rng.seed, rng_family（若使用随机化算子）。
- quant_profile = {scale, zero_point, per_channel:boolean}。
- clock_align = {alpha_D, beta_D}。
采样与分层：
- 分层按 {site, device_class, dtype_policy} 与 cohort；每层设 N_min 与最大占比，避免单层主导。
- 高基数字段一律 hash(·) 或匿名化，遵从脱敏策略（见第4章）。
入湖与追溯：
建立 anchor → (IPC,PC) → Runtime → Event 链；全链 fingerprint 与 signature 必填。

V. 算法与实现绑定

原型
- I40-40 plan_cross_device_tests(matrix:dict) -> TestPlan
- I40-41 run_equivalence(plan:TestPlan) -> {delta_dev:float, Delta_ECE:float, Delta_NLL:float, report:any}
- I40-42 align_multisite_time(traces:any, ref:any) -> {alpha:dict, beta:dict, fit:dict}
- I40-43 estimate_quant_error(runtime:Runtime, x:any) -> {bound:float, profile:dict}
- I40-44 domain_shift_weight(pA:any, pB:any, method:str) -> w:any
- I40-45 transport_ab(off:any, on:any, policy:dict) -> TransportReport
- I40-46 compose_slo_multisite(slo_list:list, weights:dict) -> {slo_e2e:dict, gaps:dict}
- I40-47 certify_equivalence(report:any, policy:dict) -> CertEq
等价检验（摘要）
- 统一时基：ts_D → ts_ref（I40-42）。
- 同一 inputs、同一 anchor、同一 IPC/PC，在 {A,B} 上双跑。
- 计算 delta_dev, Delta_ECE, Delta_NLL 与分层分位差：Q_0.95( | y_hat_A - y_hat_B | )。
- 判定：meet = ( delta_dev <= tau_dev ) AND ( |Delta_ECE| <= tau_cal ) AND ( |Delta_NLL| <= tau_nll )。
- 产出 CertEq 与可复验脚本。
偏差预算分摊
- budget.quant（量化与舍入）、budget.rng（随机化算子）、budget.sched（并行/调度）、budget.kernel（实现差异）、budget.sensor（输入链路差异）。
- 采用加法保守合成：budget.bias = Σ budget.*；若来源独立，可用平方可加上界：budget.bias <= sqrt( Σ budget.*^2 )。

VI. 计量流程与运行图（Mx-71 → Mx-78）

Mx-71 跨域基线对齐
收集各 site 样本与 clock_align 参数；执行 I40-42 生成 ts_ref 映射并回写 Runtime。
Mx-72 运输与对照设计
I40-40 生成 TestPlan：分层采样、A/B 对照、干预因子仅限 {device_class, dtype_policy}。
Mx-73 双跑与差异计算
执行 I40-41；输出 delta_dev、Delta_ECE、Delta_NLL、分层差异热图与尾部分位。
Mx-74 量化误差剖析
运行 I40-43 获取层级敏感度与 bound；若 bound > tau_quant，建议回退 dtype_policy 或启用感知量化校正。
Mx-75 域偏移与重加权
估计 w(x,y)（I40-44）；重评 R_exp^B 与 ECE_B，生成漂移报告与再校准建议。
Mx-76 SLO 端到端合成
I40-46 按权重 {traffic_share, risk_weight} 合成跨站点 SLO 与差距向量 gap。
Mx-77 证书与异常处置
I40-47 生成 CertEq；若不达标，进入降级/回退：A/B 切回 stable，或执行 canary 比例下调（见第10章）。
Mx-78 季度再认证
建立周期复验：更新 TestPlan、阈值与预算；归档 AuditLog 与 CertEq。

VII. 验证与测试矩阵

量化迁移：fp32 → int8 于 {CPU,GPU} 双跑，验证 delta_dev <= tau_dev，|Delta_ECE| <= tau_cal。
并行度扰动：固定 dtype_policy，改变线程与流数，检测 budget.sched 对尾延迟与 delta_dev 的影响。
随机化隔离：开启/关闭 dropout/MC 推理（若存在），验证 budget.rng 估计与重放幂等（记录 rng.seed、rng_family）。
传感器谱差：两站点输入经 S_xx(f) 估算 eps_spec，验证 k_spec * eps_spec 上界与实测 delta_dev 的吻合度。
域偏移再校准：用 w(x,y) 重加权评估 R_exp^B 与 ECE_B，检验 S42-72 的方差项估计。
端到端 SLO：多站点合成后，检查 slo_e2e 与单站 SLO 的一致性与最小值原则的保守性。
灰度与回退：canary 比例从 p 递增到 P，每阶验证 delta_dev 与事件率不劣化后再晋级。

VIII. 交叉引用与依赖

依第6章的 delta_offon 与时基对齐；第7章的 ECE/MCE/NLL 校准口径；第8章的 SLO 目标与权重；第9章 IPC/PC 字段与变更剧本；第10章告警与回退执行；《Core.Sea》《Core.Metrology》《Core.Errors》之时基、谱度量与错误枚举。

IX. 风险、限制与开放问题

极端域偏移下，重要性加权的方差膨胀；需设 clip(w, w_max) 与稳健损失。
某些加速器的内核实现非严格逐点等价，budget.kernel 难以精准上界；建议引入参考核对照与合约测试。
量化后在稀疏区间的非线性放大可能破坏 1-Lipschitz 假设；需层级局部 Lipschitz 估计与门限自适应。
多域 SLO 权重选择带有业务主观性；建议保守原则：SLO.compose = min( SLO_site ) 并披露权重。

X. 交付件与版本管理

交付件
- CrossDomainTestPlan.yaml：Mx-72 生成的运输与对照方案。
- EquivalenceReport.md：delta_dev/Delta_ECE/Delta_NLL 与分层结果。
- QuantAnalysis.json：层级敏感度与误差上界。
- DomainShiftReport.md：w(x,y) 方法、稳定性与再校准建议。
- SLO-Multisite.yaml：合成策略与权重。
- CertEq.pdf：等价证书与有效期。
- AuditLog.csv：可追溯记录与签名。
版本策略
- 任一跨设备阈值（如 tau_dev, tau_cal）与权重调整，必须更新 PC.meta.parent_fingerprint 并重新出具 CertEq。
- TestPlan、报告与证书按 canary/stable/LTS 通道归档；证书到期前 Mx-78 自动触发复验。
- 任何核实现或 dtype_policy 变更须先通过 Mx-71 → Mx-77 全链路再放量。

版权与许可：除另有说明外，《能量丝理论》（含文本、图表、插图、符号与公式）的著作权由作者（屠广林）享有。
许可方式（CC BY 4.0）：在注明作者与来源的前提下，允许复制、转载、节选、改编与再分发。
署名格式（建议）：作者：屠广林｜作品：《能量丝理论》｜来源：energyfilament.org｜许可证：CC BY 4.0
验证召集： 作者独立自费、无雇主无资助；下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地，不限国家。欢迎各国媒体与同行抓住窗口组织验证，并与我们联系。
版本信息： 首次发布：2025-11-11 ｜当前版本：v6.0+5.05