目录文档-技术白皮书03-EFT.WP.Core.Parameters v1.0

第6章 校准与推断流程


第6章 校准与推断流程


I. 章节目标与范围


II. 输入输出与口径

  1. 输入集合
    • 模型:y = f(x; theta) 或约束型 R(u, theta) = 0 附带观测映射 y = G(u).
    • 数据:data = { (x_k, y_k) }_{k=1..N },噪声协方差 Σ,权重矩阵 W = Σ^{-1}。
    • 先验与边界:prior(theta),lb ≤ theta ≤ ub,C_eq(theta)=0,C_ineq(theta) ≤ 0。
  2. 输出集合
    • 点估计:theta_MLE,theta_MAP;后验样本:{ theta^{(s)} }_{s=1..S}。
    • 诊断:Fisher(theta_hat),Cov[theta],Corr[theta],信息准则与交叉验证分数。
    • 报告工件:无量纲化参数表、收敛曲线、残差与灵敏度摘要。

III. 极大似然(MLE)目标与约束(最小方程 S61-1)

  1. 定义加权负对数似然:
    • l(theta) def= - log L(data | theta) = ( 1 / 2 ) * Σ_{k=1..N} ( r_k(theta)^T * W_k * r_k(theta) ) + const
    • 残差:r_k(theta) = y_k - f(x_k; theta)
  2. 约束型 MLE:
    minimize_theta l(theta) subject to lb ≤ theta ≤ ub, C_eq(theta)=0, C_ineq(theta) ≤ 0
  3. 高斯近似下的梯度与 Hessian:
    • ∂l/∂theta = - J^T * W * r
    • ∂^2 l/∂theta^2 approx J^T * W * J(忽略二阶项 ∂J/∂theta)

IV. 最大后验(MAP)与正则化(最小方程 S61-2)

  1. 后验与负对数后验:
    • post(theta | data) def= L(data | theta) * prior(theta) / Z
    • U(theta) def= - log post(theta | data) = l(theta) - log prior(theta) + const
  2. 典型先验示例:
    • prior(theta_i) = Normal(mu_i, sigma_i) ⇒ - log prior(theta_i) = ( 1 / 2 ) * ( (theta_i - mu_i)^2 / sigma_i^2 ) + const
    • 结构稀疏:prior(theta_i) = Laplace(b) ⇒ - log prior(theta_i) = |theta_i| / b + const
  3. MAP 优化问题:
    minimize_theta U(theta) subject to lb ≤ theta ≤ ub, C_eq=0, C_ineq ≤ 0

V. 贝叶斯采样(MCMC)与后验估计(最小方程 S61-3)

  1. 目标密度:π(theta) ∝ exp( - U(theta) )
  2. 采样策略:
    • 梯度驱动:NUTS/HMC,需提供 ∂U/∂theta(由 I30 10 的 compute_jacobian 与先验梯度组成)。
    • 难以求导时:RandomWalk Metropolis 或 Adaptive Metropolis(效率次优)。
  3. 后验统计:
    • E[theta_i | data] approx ( 1 / S ) * Σ_{s=1..S} theta_i^{(s)}
    • Cov[theta] approx covariance( { theta^{(s)} } )
    • 区间:CI_{1-α}[theta_i] 取样本分位数或正态近似。

VI. 多数据集联合校准(最小方程 S61-4)

  1. 数据簇 data = { data_m }_{m=1..M } 与权重 w_m ≥ 0:
    • log L_joint(data | theta) = Σ_{m=1..M} w_m * log L_m(data_m | theta)
    • U_joint(theta) = - log L_joint - log prior(theta) + const
  2. 权重策略:
    • 噪声同质:w_m = 1
    • 噪声异质:w_m = 1 / σ_m^2 或按样本数归一 w_m = n_m / Σ n_m
  3. 场景化治理:在 create_scenario 中记录 { data_m, w_m } 与版本,以保证可复现。

VII. 到达时耦合的专用口径(与 S20- 一致)*


VIII. 信息准则与交叉验证(最小方程 S61-5)

  1. 以 θ_hat 表示点估计,p = dim(theta_free),N = 样本量。
  2. AIC 与 BIC:
    • AIC = 2 * p - 2 * log L(data | θ_hat)
    • BIC = p * log(N) - 2 * log L(data | θ_hat)
  3. WAIC(后验平均对数密度):
    • lppd = Σ_{k=1..N} log( ( 1 / S ) * Σ_{s=1..S} p(y_k | theta^{(s)}) )
    • p_waic = Σ_{k=1..N} Var_{s}( log p(y_k | theta^{(s)}) )
    • WAIC = -2 * ( lppd - p_waic )
  4. LOO-CV(近似):
    ELPD_LOO = Σ_{k=1..N} log( p_{-k}(y_k) )(可用 Pareto-smoothed importance 近似)
  5. 早停判据(验证集 val):
    若 Δ log L(val | θ_t) < ε_ll 持续 K 轮,或 Corr[theta]_t 持续恶化,则触发早停。

IX. 无量纲化与变换策略(与第3章对齐)


X. 校准流水线 Mx-2(标准步骤)


XI. 实现绑定与最小工作示例(I30 5 族)

  1. 点估计:
    • theta_mle = infer_mle(model, data_train, params=theta_free)
    • theta_map = infer_map(model, data_train, params=theta_free)
  2. 后验:
    samples = posterior_sample_mcmc(model, data_train, params=theta_free, n=S, burn=B, method="NUTS")
  3. 联合:
    calibrate_joint(datasets=[D1,...,DM], weights=[w1,...,wM], params=theta_free)
  4. 诊断:
    fisher_information(model, theta_map, data_train);regularize_cov(Cov, "shrinkage", alpha)
  5. 跨卷梯度:
    J = compute_jacobian(eqn=S20_arrival, params=[...]) 对接到 infer_* 的一阶与二阶信息。

XII. 误用与冲突清单


XIII. 输出锚点与引用


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/