03-EFT.WP.Core.Parameters v1.0 | 第6章校准与推断流程 | 能量丝理论

第6章校准与推断流程

I. 章节目标与范围

统一定义 MLE、MAP、MCMC 与联合校准的数学口径与流程接口，保证与 I30 5、I30 6、I30 10 的一致对接。
给出信息准则与交叉验证的评估规则与早停策略，形成可复现实验流水线 Mx-2。
典型耦合场景：基于到达时 T_arr = ( ∫ ( n_eff / c_ref ) d ell ) 的参数校准，显式声明路径 gamma(ell) 与测度 d ell。

II. 输入输出与口径

输入集合
- 模型：y = f(x; theta) 或约束型 R(u, theta) = 0 附带观测映射 y = G(u).
- 数据：data = { (x_k, y_k) }_{k=1..N }，噪声协方差 Σ，权重矩阵 W = Σ^{-1}。
- 先验与边界：prior(theta)，lb ≤ theta ≤ ub，C_eq(theta)=0，C_ineq(theta) ≤ 0。
输出集合
- 点估计：theta_MLE，theta_MAP；后验样本：{ theta^{(s)} }_{s=1..S}。
- 诊断：Fisher(theta_hat)，Cov[theta]，Corr[theta]，信息准则与交叉验证分数。
- 报告工件：无量纲化参数表、收敛曲线、残差与灵敏度摘要。

III. 极大似然（MLE）目标与约束（最小方程 S61-1）

定义加权负对数似然：
- l(theta) def= - log L(data | theta) = ( 1 / 2 ) * Σ_{k=1..N} ( r_k(theta)^T * W_k * r_k(theta) ) + const
- 残差：r_k(theta) = y_k - f(x_k; theta)
约束型 MLE：
minimize_theta l(theta) subject to lb ≤ theta ≤ ub, C_eq(theta)=0, C_ineq(theta) ≤ 0
高斯近似下的梯度与 Hessian：
- ∂l/∂theta = - J^T * W * r
- ∂^2 l/∂theta^2 approx J^T * W * J（忽略二阶项 ∂J/∂theta）

IV. 最大后验（MAP）与正则化（最小方程 S61-2）

后验与负对数后验：
- post(theta | data) def= L(data | theta) * prior(theta) / Z
- U(theta) def= - log post(theta | data) = l(theta) - log prior(theta) + const
典型先验示例：
- prior(theta_i) = Normal(mu_i, sigma_i) ⇒ - log prior(theta_i) = ( 1 / 2 ) * ( (theta_i - mu_i)^2 / sigma_i^2 ) + const
- 结构稀疏：prior(theta_i) = Laplace(b) ⇒ - log prior(theta_i) = |theta_i| / b + const
MAP 优化问题：
minimize_theta U(theta) subject to lb ≤ theta ≤ ub, C_eq=0, C_ineq ≤ 0

V. 贝叶斯采样（MCMC）与后验估计（最小方程 S61-3）

目标密度：π(theta) ∝ exp( - U(theta) )
采样策略：
- 梯度驱动：NUTS/HMC，需提供 ∂U/∂theta（由 I30 10 的 compute_jacobian 与先验梯度组成）。
- 难以求导时：RandomWalk Metropolis 或 Adaptive Metropolis（效率次优）。
后验统计：
- E[theta_i | data] approx ( 1 / S ) * Σ_{s=1..S} theta_i^{(s)}
- Cov[theta] approx covariance( { theta^{(s)} } )
- 区间：CI_{1-α}[theta_i] 取样本分位数或正态近似。

VI. 多数据集联合校准（最小方程 S61-4）

数据簇 data = { data_m }_{m=1..M } 与权重 w_m ≥ 0：
- log L_joint(data | theta) = Σ_{m=1..M} w_m * log L_m(data_m | theta)
- U_joint(theta) = - log L_joint - log prior(theta) + const
权重策略：
- 噪声同质：w_m = 1
- 噪声异质：w_m = 1 / σ_m^2 或按样本数归一 w_m = n_m / Σ n_m
场景化治理：在 create_scenario 中记录 { data_m, w_m } 与版本，以保证可复现。

VII. 到达时耦合的专用口径（与 S20- 一致）*

若观测为到达时 y_k = T_arr( gamma_k; theta )：
T_arr( gamma_k; theta ) = ( ∫_{gamma_k} ( n_eff(x; theta) / c_ref(theta) ) d ell )
残差：
r_k(theta) = y_k - ( ∫_{gamma_k} ( n_eff / c_ref ) d ell )
梯度（见 S51-4）：
∂r_k/∂theta_i = - ( ∫_{gamma_k} ( ( ∂ n_eff / ∂theta_i ) / c_ref - n_eff * ( ∂ c_ref / ∂theta_i ) / ( c_ref^2 ) ) d ell )
计算接口：
路径离散化 discretize_path，积算接口 propagate_time，导数由 compute_jacobian 汇总。

VIII. 信息准则与交叉验证（最小方程 S61-5）

以 θ_hat 表示点估计，p = dim(theta_free)，N = 样本量。
AIC 与 BIC：
- AIC = 2 * p - 2 * log L(data | θ_hat)
- BIC = p * log(N) - 2 * log L(data | θ_hat)
WAIC（后验平均对数密度）：
- lppd = Σ_{k=1..N} log( ( 1 / S ) * Σ_{s=1..S} p(y_k | theta^{(s)}) )
- p_waic = Σ_{k=1..N} Var_{s}( log p(y_k | theta^{(s)}) )
- WAIC = -2 * ( lppd - p_waic )
LOO-CV（近似）：
ELPD_LOO = Σ_{k=1..N} log( p_{-k}(y_k) )（可用 Pareto-smoothed importance 近似）
早停判据（验证集 val）：
若 Δ log L(val | θ_t) < ε_ll 持续 K 轮，或 Corr[theta]_t 持续恶化，则触发早停。

IX. 无量纲化与变换策略（与第3章对齐）

参数进入优化前一律变换到实线：
phi_i = T_map(theta_i)，如 log、logit、softplus
目标函数在 phi 空间：
U_phi(phi) = U( T_map^{-1}(phi) ) - log | det( ∂ T_map^{-1} / ∂ phi ) |
数据与输出采用基准：
bar_y = y / y0，bar_t = t / t0，bar_L = L / L0；检查 check_dim(expr) 通过后再优化。

X. 校准流水线 Mx-2（标准步骤）

XI. 实现绑定与最小工作示例（I30 5 族）

点估计：
- theta_mle = infer_mle(model, data_train, params=theta_free)
- theta_map = infer_map(model, data_train, params=theta_free)
后验：
samples = posterior_sample_mcmc(model, data_train, params=theta_free, n=S, burn=B, method="NUTS")
联合：
calibrate_joint(datasets=[D1,...,DM], weights=[w1,...,wM], params=theta_free)
诊断：
fisher_information(model, theta_map, data_train)；regularize_cov(Cov, "shrinkage", alpha)
跨卷梯度：
J = compute_jacobian(eqn=S20_arrival, params=[...]) 对接到 infer_* 的一阶与二阶信息。

XII. 误用与冲突清单

XIII. 输出锚点与引用

最小方程：S61-1（MLE 负对数似然）、S61-2（MAP 负对数后验）、S61-3（后验采样密度）、S61-4（联合校准）、S61-5（信息准则与交叉验证）。
标准流程：Mx-2（校准流水线）。
实现接口：I30 5（推断与校准）、I30 6（识别度）、I30 10（跨卷 Jacobian）。
跨卷引用：见《EFT.WP.Core.Equations》S20-*（到达时）、S40-*（张度场）与本卷第3章（变换）。