目录 / 文档-技术白皮书 / 26-EFT.WP.STG.Lensing v1.0
一句话目标:以数据驱动方式学习 K_θ = g(L_*),在监督/自监督两范式下实现可审计、可泛化且因果不变的透镜,并保持与谱/变分两口径的对齐。
I. 范围与对象
- 输入
- 图与算子:G=(V,E,w);L_* ∈ {L, L^vis, L_ani}(见第4/5章),unit(L_*)=1。
- 数据集:D = { (x_i, y_i, e_i) }(监督,y_i 为目标;e_i 为环境标签)或 D = { (x_i, e_i) }(自监督)。
- 先验与约束:Stab/Monotone/Passivity 对 g(λ; θ) 的约束;结构先验(路径/稀疏/各向异性)。
- 输出
- 学习透镜:K_θ = g(L_*; θ)(可用切比雪夫/有理分式近似实现 matvec)。
- 推断产物:x_hat = K_θ x,两口径差 delta_form_ml。
- 不变性报告:跨环境风险 R_e、不变性度量与漂移监测。
- 边界
unit(x_hat)=unit(x);θ 无量纲;训练与评估的环境集合需显式记录。
II. 名词与变量
- 学习核参数:θ;谱核 g(λ; θ);学习算子 K_θ = U g(Λ; θ) U^T。
- 监督风险:R_sup(θ)= E[ ℓ( K_θ x , y ) ],ℓ ∈ {L2, Huber, D_KL}。
- 自监督一致性:R_ssl(θ)= E[ d( K_θ Aug(x), Aug'( K_θ x ) ) ],Aug 为图/谱一致增强。
- 因果不变:IRM/GroupDRO 正则,R_inv(θ)= ∑_e || ∇_w R_e(w∘K_θ)|_{w=1} ||_2^2 或 max_e R_e(θ)。
- 两口径差:delta_form_ml = || x_spec - x_var ||_2。
- 参数化:g(λ; θ)=∑_{k=0}^m a_k T_k(\tilde{λ})(切比雪夫,tilde(λ) ∈ [-1,1]),或有理式 p(λ)/q(λ)。
III. 公设 P719-*
- P719-1(两口径并行):任何学习透镜必须给出谱实现 x_spec = (U g(Λ; θ) U^T) x 与变分等价 x_var = prox_{μ R}(x)(若存在),并记录 delta_form_ml。
- P719-2(有界稳定):强制 sup_λ |g(λ; θ)| ≤ 1+ε 与 g(0; θ) ∈ [0,1];训练中投影 θ ← Π_Θ(θ)。
- P719-3(因果不变):训练目标必须含环境不变项 R_inv;若无环境标签,需构造代理环境(子图/时间窗/域标签)。
- P719-4(可追溯):L_*、参数化方式、order/λ_max、增强族与环境划分均需落盘 hash(*)。
- P719-5(噪声匹配):损失的统计假设与观测噪声一致(高斯/Poisson/Laplace)。
- P719-6(单位与量纲):check_dim( K_θ x - y ) = "[unit(y)]";学习不改变量纲。
IV. 最小方程 S719-*
- S719-1(监督学习)
( θ_hat ) = argmin_θ ( E_{(x,y)}[ ℓ( K_θ x , y ) ] + μ ||θ||_2^2 + γ R_struct(θ) ),
其中 R_struct 约束 g(λ; θ) 的单调/平滑:R_struct = ∑_λ ( d^2 g / dλ^2 )^2。 - S719-2(自监督一致性)
θ_hat = argmin_θ E_x [ d( K_θ Aug(x), Aug'( K_θ x ) ) + α d_spec( g(Λ; θ), S_target ) ],
其中 S_target 为期望谱形(如带通/低通),d_spec 为谱距离(如 L2 于采样点)。 - S719-3(因果不变/多环境)
θ_hat = argmin_θ ( ∑_e R_e(θ) + β R_inv(θ) ),
或 θ_hat = argmin_θ max_{e∈E} R_e(θ)(GroupDRO)。 - S719-4(谱参数化与稳定投影)
- g(λ; θ)=∑_{k=0}^m a_k T_k(\tilde{λ}),并对系数施加 ∞-范数约束:|∑ a_k T_k| ≤ 1+ε;
- 有理式:g(λ)= (∑ b_i λ^i) / (1 + ∑ c_j λ^j),约束 q(λ) 零点远离 [0,λ_max]。
- S719-5(变分等价与近端展开)
- 若 g(λ) = 1 / (1 + μ λ^p),则 K_θ ≡ (I + μ L_*^p)^{-1} 与 prox_{(μ/2)||L_*^{p/2}·||_2^2} 等价;
- 对一般 g,以 prox 级联近似 x_var = prox_{R_m} ∘ … ∘ prox_{R_1}(x) 拟合 g。
- S719-6(两口径差)
delta_form_ml = || (U g(Λ; θ) U^T) x - x_var ||_2,契约要求 ≤ tol_ml。
V. 计量流程 M71-9(就绪→训练→蒸馏→校核→落盘)
- 就绪:选 L_* 与参数化族;划分环境 E(地域/时段/域源);定义增强 Aug。
- 训练:最小化 R_sup 或 R_ssl + R_inv;每 T 步执行稳定投影与谱形审计。
- 蒸馏/可部署化:将 θ_hat 蒸馏为低阶切比雪夫系数或有理式,生成 apply(K_θ) 的 matvec。
- 两口径求解:以谱实现与变分近端展开并行得到 x_spec, x_var,计算 delta_form_ml。
- 不变性与漂移评估:报告 max_e R_e、gap= max_e R_e - min_e R_e、IRM_penalty。
- 校核:ρ(K_θ), cond(*), u_c(x_hat), PSNR/SSIM(若有 y);触发回退策略(见 IX)。
- 落盘:manifest.lens.learn.* = {L_*.hash, param.kind, order, λ_max, θ.hash, distill.kind, tol_ml, ρ, metrics, env_splits.hash, aug.hash, contracts.*, signature}。
VI. 契约与断言 C71-9x(建议阈值)
- C71-91(稳定有界):sup_λ |g(λ; θ)| ≤ 1.02;ρ(K_θ) ≤ 1.02。
- C71-92(两口径一致):delta_form_ml ≤ 1e-3 ||x||_2(二次等价),含非平滑先验放宽至 3e-3。
- C71-93(不变性):"最坏环境" 超差:max_e R_e ≤ κ · median_e R_e,κ∈[1.15,1.3]。
- C71-94(泛化差):"域间差":gap ≤ τ(默认 τ=10% 相对误差)。
- C71-95(训练可追溯):必须提供 seed, optimizer, lr_schedule, epochs, early_stop.rule,以及 θ.hash。
- C71-96(单位一致):check_dim( K_θ x - y ) = "[unit(y)]"。
- C71-97(近似阶):蒸馏后 err_spec∞ = sup_λ |g(λ; θ) - ĝ(λ)| ≤ 5e-3。
VII. 实现绑定 I71-9*(接口原型、输入输出、不变量)
- train_lens_supervised(L_*, param_spec, data, loss, inv_reg, opts) -> {θ_hat, reports}
- train_lens_ssl(L_*, param_spec, data, aug, inv_reg, opts) -> {θ_hat, reports}
- distill_kernel(θ_hat, param_spec, target_order) -> {ĝ_coeffs, err_spec∞}
- apply_learned_lens(L_*, ĝ_coeffs, x) -> x_spec, meta
- prox_stack_builder(ĝ_coeffs) -> {prox_list, x_var_fn}
- eval_invariance(θ_hat, splits) -> {R_e, gap, irm_penalty}
- eval_delta_form(x_spec, x_var) -> delta_form_ml
- assert_learning_contracts(ds, rules) -> report
- emit_lens_manifest(results, policy) -> manifest.lens
不变量:order ≥ 0;λ_max>0;θ、增强、环境划分的 hash(*) 必填;部署仅接受蒸馏后的 ĝ_coeffs。
VIII. 交叉引用
- 核与谱域实现:本卷第5章;多层组合:第8章(用于蒸馏后结构化部署)。
- 图算子与核近似:见《EFT.WP.STG.Dynamics v1.0》第4章;数值稳定与刚性:见其第9章。
- 因果与不变性:见《EFT.WP.STG.Dynamics v1.0》第10章。
- 路径/拓扑先验与门控来源:见《EFT.WP.Particle.TopologyAtlas v1.0》第7/9章。
IX. 质量与风控
- SLI/SLO:rho_p95, delta_form_ml_p99, err_spec∞_p95, PSNR/SSIM_p50, latency_p95, drift_score, max_env_gap。
- 回退策略:
- 稳定性超界→增加正则或降阶蒸馏;
- 不变性失效→提升 β 或切换 GroupDRO;
- 两口径差过大→增补 prox 层或提高谱近似阶;
- 漂移告警→触发再训练或锁定到上一个签名版本。
- 审计:保存 g(λ; θ_hat) 采样曲线、训练曲线、环境风险表、蒸馏误差、manifest 签名链与可复现配置。
小结
- 本章给出学习型透镜在监督/自监督/因果不变三要素下的统一目标函数与稳定约束;
- 通过谱参数化 + 变分等价 + 蒸馏实现可部署与可追溯;
- 以 delta_form_ml、ρ(K_θ) 与跨环境风险为核心 SLI/SLO,并提供契约与回退路径,落盘于 manifest.lens.learn.*。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/