目录文档-技术白皮书(V5.05)18-EFT.WP.Methods.CrossStats v1.0

第10章 因果推断与去混杂(PS/IPW/DR/IV)


一句话目标:在非随机试验与跨域场景下,基于倾向评分、逆概率加权、双稳健与工具变量建立可审计的 ATE/ATT/CATE 估计闭环,并以契约保证重叠性、平衡性与时基一致。


I. 范围与对象

  1. 范围
    • 适用于二分类处理 T ∈ {0,1} 与多分类/连续处理的线性近似;覆盖离线与在线流式估计、跨域迁移与随时间漂移。
    • 支持配对/最近邻匹配、加权(IPW/稳定权重/截尾)、回归调整、双稳健(AIPW/TMLE)与工具变量(IV/2SLS/局部平均处理效应)。
  2. 对象
    • 输入:D = { (X_i, T_i, Y_i, ts_i) }、模型族与正则策略、窗口 Delta_t、时基 tau_mono、到达时参数(如使用 T_arr 指标)。
    • 输出:ATE, ATT, ATC, CATE(x) 及不确定度 U = k * u_c,平衡与重叠报告、manifest.stats.causal.*。

II. 名词与变量


III. 公设 P310-*


IV. 最小方程 S310-*

  1. S310-1(目标量)
    ATE = E[ Y(1) - Y(0) ];ATT = E[ Y(1) - Y(0) | T=1 ];ATC = E[ Y(1) - Y(0) | T=0 ]。
  2. S310-2(IPW 估计,归一版)
    • mu1 = ( ∑ T_i * Y_i / e_hat(X_i) ) / ( ∑ T_i / e_hat(X_i) );
    • mu0 = ( ∑ (1-T_i) * Y_i / ( 1 - e_hat(X_i) ) ) / ( ∑ (1-T_i) / ( 1 - e_hat(X_i) ) );
    • ATE_IPW = mu1 - mu0。
  3. S310-3(双稳健 AIPW)
    ATE_DR = ( 1 / n ) * ∑ [ m1_hat(X_i) - m0_hat(X_i) + T_i * ( Y_i - m1_hat(X_i) ) / e_hat(X_i) - (1-T_i) * ( Y_i - m0_hat(X_i) ) / ( 1 - e_hat(X_i) ) ]。
  4. S310-4(匹配与平衡)
    最近邻匹配 match(s_i) 保证 SMD_k ≤ tol_smd;匹配后差值 ATE_match = ( 1 / n_m ) * ∑ ( Y_i - Y_{j(i)} )。
  5. S310-5(IV:Wald 与 2SLS)
    • 二元 Z 的 LATE:LATE = ( E[Y|Z=1] - E[Y|Z=0] ) / ( E[T|Z=1] - E[T|Z=0] )。
    • 2SLS:beta_2SLS = ( X' P_Z X )^{-1} X' P_Z Y,其中 X = [1, T, W],W 为协变量。
  6. S310-6(不确定度与稳健方差)
    • 线性化/三明治方差:Var_hat( beta ) = ( X' P_Z X )^{-1} ( X' P_Z hat{u} hat{u}' P_Z X ) ( X' P_Z X )^{-1};
    • 重抽样:U = k * u_c 对应 BCa/自助法区间。
  7. S310-7(重叠与权重稳定)
    W_norm = ( ∑ w ) / n ≈ 1;var(w) ≤ tol_wvar;ESS ≥ ESS_min。
  8. S310-8(条件效应)
    CATE(x) = E[ Y(1) - Y(0) | X=x ],以分层或局部回归估计,保留 smoothed_CATE(x) 与区间。
  9. S310-9(时间一致与到达时)
    窗口化估计:ATE(Delta_t) = ( 1 / |W| ) * ∑_{i∈W} tau_i;涉及 T_arr 的指标需并行两口径并记录 delta_form。

V. 统计流程 M30-10(就绪→估计→诊断→发布)


VI. 契约与断言 C30-101x


VII. 实现绑定 I30-*

不变量:sum(weights)/n ≈ 1;ESS ≥ ESS_min;contract_report.pass == true 方可发布;TraceID 与版本签名齐备。


VIII. 交叉引用


IX. 质量与风控


小结

本章确立 PS/IPW/DR/IV 的统一识别—估计—诊断—发布闭环,以 C30-101x 契约约束重叠与平衡、到达时一致与审计可追溯,产出 ATE/ATT/CATE 及其不确定度并可在漂移中稳健运行。

版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05