目录文档-技术白皮书15-EFT.WP.Methods.Falsification v1.0

第8章 不确定性与证伪置信


I. 范围与目标


II. 术语与符号

  1. 后验与预测
    • p(theta | D),p(y | x, theta),p(y | x, D) = ( ∫ p(y | x, theta) p(theta | D) d theta )。
    • 预测矩:mean = E[ y | x, D ],var = Var[ y | x, D ],quantile_q。
  2. 区间与集合
    • 置信区间 CI_{1 - delta_cov};贝叶斯置信区间 CrI_{1 - delta_cov};预测区间 PI_{1 - delta_cov}。
    • 保形预测集 Pi(x) = { y : S(x,y) ≤ q_{1 - delta_cov} },其中 S(x,y) 为非一致性分数。
  3. 不确定性分解
    var_total = E_{p(theta|D)}[ var( y | x, theta ) ] + var_{p(theta|D)}( E[ y | x, theta ] )(分别对应 aleatoric 与 epistemic)。
  4. 校准与度量
    • ECE,MCE,NLL = ( - 1/N ) * Σ log p_hat( y_i | x_i ),Brier = ( 1/N ) * Σ || p_hat_i - onehot(y_i) ||_2^2。
    • 分桶:bins = {B_b},conf_b(平均置信),acc_b(平均准确)。
  5. 在线守门与风险
    违例概率:P( violation | D );风险预算 rho_budget;策略阈值 {tau_pass, tau_hold, tau_block}。
  6. 失配与漂移
    • 一致度:delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) ),R_infer = 1 - delta_offon。
    • OOD(x)(分布外分数),门限 tau_ood。

III. 公设与最小方程


IV. 数据与清单口径


V. 算法与实现绑定

  1. 原型映射(扩展 I50-*)
    • I50-14 calibrate_temperature(logits:any, labels:any) -> {T:float, CalibReport}
    • I50-15 calibrate_isotonic(scores:list, labels:list) -> CalibModel
    • I50-16 conformal_calibrate(scores:list, labels:list, delta_cov:float, mode:str) -> {q:float, Pi}
    • I50-17 estimate_uncertainty(runtime:any, x:any, method:str) -> {mean:float, var:float, meta:dict}
    • I50-18 ood_score(x:any, method:str) -> float
  2. 参考流程(ECE 计算)
    • 以 bins 将 conf 分桶,得 B_b。
    • acc_b = ( 1/|B_b| ) * Σ 1[ y_i = argmax p_hat_i ],conf_b = ( 1/|B_b| ) * Σ max p_hat_i。
    • 输出 ECE 与 MCE,并生成可靠性表与图。
  3. 参考流程(Conformal split)
    • 计算校准集分数 S(x_j, y_j),取 q_{1 - delta_cov}。
    • 预测时返回 Pi(x) 或区间 PI_{1 - delta_cov}(x);记录覆盖指示 Z_i。
  4. 参考流程(风险联动)
    • 计算 r = P( violation | D ) 或近似上界 r_hat。
    • 应用 S52-36 与 S52-35,输出 GateDecision 与解释字段 {ECE, cov_hat, OOD(x)}。

VI. 计量流程与运行图


VII. 验证与测试矩阵

  1. 校准有效性
    • ECE ≤ ECE_target,NLL ≤ NLL_target。
    • reliability.csv 无系统性偏差(MCE 在阈内)。
  2. 覆盖与稳健性
    • 在验证集与 OOD 子集分别估计 cov_hat 与 Wilson 区间;要求 cov_hat ≥ 1 - delta_cov - tau_cov。
    • 失交换性情境下(打乱或漂移),报告覆盖退化与置信修正策略。
  3. 决策正确性
    回放日志中 GateDecision 的误阻断与漏阻断率,满足 budget.power 与 rho_budget。
  4. 漂移与一致性
    当 delta_offon 超阈时,ECE/cov_hat 变化触发 hold/block,验证联动及时性与误报率。

VIII. 交叉引用与依赖


IX. 风险、限制与开放问题


X. 交付件与版本管理


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/