目录 / 文档-技术白皮书 / 03-EFT.WP.Core.Parameters v1.0
第6章 校准与推断流程
I. 章节目标与范围
- 统一定义 MLE、MAP、MCMC 与联合校准的数学口径与流程接口,保证与 I30 5、I30 6、I30 10 的一致对接。
- 给出信息准则与交叉验证的评估规则与早停策略,形成可复现实验流水线 Mx-2。
- 典型耦合场景:基于到达时 T_arr = ( ∫ ( n_eff / c_ref ) d ell ) 的参数校准,显式声明路径 gamma(ell) 与测度 d ell。
II. 输入输出与口径
- 输入集合
- 模型:y = f(x; theta) 或约束型 R(u, theta) = 0 附带观测映射 y = G(u).
- 数据:data = { (x_k, y_k) }_{k=1..N },噪声协方差 Σ,权重矩阵 W = Σ^{-1}。
- 先验与边界:prior(theta),lb ≤ theta ≤ ub,C_eq(theta)=0,C_ineq(theta) ≤ 0。
- 输出集合
- 点估计:theta_MLE,theta_MAP;后验样本:{ theta^{(s)} }_{s=1..S}。
- 诊断:Fisher(theta_hat),Cov[theta],Corr[theta],信息准则与交叉验证分数。
- 报告工件:无量纲化参数表、收敛曲线、残差与灵敏度摘要。
III. 极大似然(MLE)目标与约束(最小方程 S61-1)
- 定义加权负对数似然:
- l(theta) def= - log L(data | theta) = ( 1 / 2 ) * Σ_{k=1..N} ( r_k(theta)^T * W_k * r_k(theta) ) + const
- 残差:r_k(theta) = y_k - f(x_k; theta)
- 约束型 MLE:
minimize_theta l(theta) subject to lb ≤ theta ≤ ub, C_eq(theta)=0, C_ineq(theta) ≤ 0 - 高斯近似下的梯度与 Hessian:
- ∂l/∂theta = - J^T * W * r
- ∂^2 l/∂theta^2 approx J^T * W * J(忽略二阶项 ∂J/∂theta)
IV. 最大后验(MAP)与正则化(最小方程 S61-2)
- 后验与负对数后验:
- post(theta | data) def= L(data | theta) * prior(theta) / Z
- U(theta) def= - log post(theta | data) = l(theta) - log prior(theta) + const
- 典型先验示例:
- prior(theta_i) = Normal(mu_i, sigma_i) ⇒ - log prior(theta_i) = ( 1 / 2 ) * ( (theta_i - mu_i)^2 / sigma_i^2 ) + const
- 结构稀疏:prior(theta_i) = Laplace(b) ⇒ - log prior(theta_i) = |theta_i| / b + const
- MAP 优化问题:
minimize_theta U(theta) subject to lb ≤ theta ≤ ub, C_eq=0, C_ineq ≤ 0
V. 贝叶斯采样(MCMC)与后验估计(最小方程 S61-3)
- 目标密度:π(theta) ∝ exp( - U(theta) )
- 采样策略:
- 梯度驱动:NUTS/HMC,需提供 ∂U/∂theta(由 I30 10 的 compute_jacobian 与先验梯度组成)。
- 难以求导时:RandomWalk Metropolis 或 Adaptive Metropolis(效率次优)。
- 后验统计:
- E[theta_i | data] approx ( 1 / S ) * Σ_{s=1..S} theta_i^{(s)}
- Cov[theta] approx covariance( { theta^{(s)} } )
- 区间:CI_{1-α}[theta_i] 取样本分位数或正态近似。
VI. 多数据集联合校准(最小方程 S61-4)
- 数据簇 data = { data_m }_{m=1..M } 与权重 w_m ≥ 0:
- log L_joint(data | theta) = Σ_{m=1..M} w_m * log L_m(data_m | theta)
- U_joint(theta) = - log L_joint - log prior(theta) + const
- 权重策略:
- 噪声同质:w_m = 1
- 噪声异质:w_m = 1 / σ_m^2 或按样本数归一 w_m = n_m / Σ n_m
- 场景化治理:在 create_scenario 中记录 { data_m, w_m } 与版本,以保证可复现。
VII. 到达时耦合的专用口径(与 S20- 一致)*
- 若观测为到达时 y_k = T_arr( gamma_k; theta ):
T_arr( gamma_k; theta ) = ( ∫_{gamma_k} ( n_eff(x; theta) / c_ref(theta) ) d ell ) - 残差:
r_k(theta) = y_k - ( ∫_{gamma_k} ( n_eff / c_ref ) d ell ) - 梯度(见 S51-4):
∂r_k/∂theta_i = - ( ∫_{gamma_k} ( ( ∂ n_eff / ∂theta_i ) / c_ref - n_eff * ( ∂ c_ref / ∂theta_i ) / ( c_ref^2 ) ) d ell ) - 计算接口:
路径离散化 discretize_path,积算接口 propagate_time,导数由 compute_jacobian 汇总。
VIII. 信息准则与交叉验证(最小方程 S61-5)
- 以 θ_hat 表示点估计,p = dim(theta_free),N = 样本量。
- AIC 与 BIC:
- AIC = 2 * p - 2 * log L(data | θ_hat)
- BIC = p * log(N) - 2 * log L(data | θ_hat)
- WAIC(后验平均对数密度):
- lppd = Σ_{k=1..N} log( ( 1 / S ) * Σ_{s=1..S} p(y_k | theta^{(s)}) )
- p_waic = Σ_{k=1..N} Var_{s}( log p(y_k | theta^{(s)}) )
- WAIC = -2 * ( lppd - p_waic )
- LOO-CV(近似):
ELPD_LOO = Σ_{k=1..N} log( p_{-k}(y_k) )(可用 Pareto-smoothed importance 近似) - 早停判据(验证集 val):
若 Δ log L(val | θ_t) < ε_ll 持续 K 轮,或 Corr[theta]_t 持续恶化,则触发早停。
IX. 无量纲化与变换策略(与第3章对齐)
- 参数进入优化前一律变换到实线:
phi_i = T_map(theta_i),如 log、logit、softplus - 目标函数在 phi 空间:
U_phi(phi) = U( T_map^{-1}(phi) ) - log | det( ∂ T_map^{-1} / ∂ phi ) | - 数据与输出采用基准:
bar_y = y / y0,bar_t = t / t0,bar_L = L / L0;检查 check_dim(expr) 通过后再优化。
X. 校准流水线 Mx-2(标准步骤)
- 数据治理:切分 train/val/test,构造 Σ 与 W,声明窗口 avg_t/avg_V/avg_gamma。
- 参数注册:register_param、设置 bounds/constraints/prior/transform,形成 theta_free。
- 可识别性预检:fisher_information 与 check_identifiability,必要时 tie_params 或 freeze。
- 初值生成:sample_prior 与启发式(无量纲域内的中位数或 zscore 标准点)。
- MLE 预热:最小化 l(theta) 获取 theta_MLE,用于 MAP 与 MCMC 的初值。
- MAP 精化:最小化 U(theta),记录 Cov approx F^{-1} 与 Corr。
- 后验采样:posterior_sample_mcmc(建议 NUTS),计算 ELPD_LOO/WAIC,生成 CI。
- 联合校准:如有多数据集,最小化 U_joint 或在 MCMC 中混合似然。
- 早停与选择:以验证集 log L、信息准则与误差阈值决策,产出最佳场景快照。
- 报告与回归:export_params("yaml") 与 compare_param_sets 建立回归基线;记录 Mx-2 元数据。
XI. 实现绑定与最小工作示例(I30 5 族)
- 点估计:
- theta_mle = infer_mle(model, data_train, params=theta_free)
- theta_map = infer_map(model, data_train, params=theta_free)
- 后验:
samples = posterior_sample_mcmc(model, data_train, params=theta_free, n=S, burn=B, method="NUTS") - 联合:
calibrate_joint(datasets=[D1,...,DM], weights=[w1,...,wM], params=theta_free) - 诊断:
fisher_information(model, theta_map, data_train);regularize_cov(Cov, "shrinkage", alpha) - 跨卷梯度:
J = compute_jacobian(eqn=S20_arrival, params=[...]) 对接到 infer_* 的一阶与二阶信息。
XII. 误用与冲突清单
- 严禁将 n 与 n_eff 互换;所有到达时公式必须写为 ( ∫ ( n_eff / c_ref ) d ell ) 并声明 gamma(ell)。
- 禁止省略变换的 Jacobian 项:在 phi 空间优化 MAP 时必须包含 log |det( ∂ T_map^{-1} / ∂ phi )|。
- 以错误噪声模型设置 W 将导致偏置估计;如未知应并行校准 σ 或采用稳健似然。
- 在 f(x; theta) ≈ 0 区域直接使用归一化灵敏度会不稳定,应改用参考尺度或截断。
- 多数据集联合时权重不可与样本重复计数叠加;需显式归一化或在似然层建模异质性。
XIII. 输出锚点与引用
- 最小方程:S61-1(MLE 负对数似然)、S61-2(MAP 负对数后验)、S61-3(后验采样密度)、S61-4(联合校准)、S61-5(信息准则与交叉验证)。
- 标准流程:Mx-2(校准流水线)。
- 实现接口:I30 5(推断与校准)、I30 6(识别度)、I30 10(跨卷 Jacobian)。
- 跨卷引用:见《EFT.WP.Core.Equations》S20-*(到达时)、S40-*(张度场)与本卷第3章(变换)。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/