目录文档-技术白皮书18-EFT.WP.Methods.CrossStats v1.0

第10章 因果推断与去混杂(PS/IPW/DR/IV)


一句话目标:在非随机试验与跨域场景下,基于倾向评分、逆概率加权、双稳健与工具变量建立可审计的 ATE/ATT/CATE 估计闭环,并以契约保证重叠性、平衡性与时基一致。


I. 范围与对象

  1. 范围
    • 适用于二分类处理 T ∈ {0,1} 与多分类/连续处理的线性近似;覆盖离线与在线流式估计、跨域迁移与随时间漂移。
    • 支持配对/最近邻匹配、加权(IPW/稳定权重/截尾)、回归调整、双稳健(AIPW/TMLE)与工具变量(IV/2SLS/局部平均处理效应)。
  2. 对象
    • 输入:D = { (X_i, T_i, Y_i, ts_i) }、模型族与正则策略、窗口 Delta_t、时基 tau_mono、到达时参数(如使用 T_arr 指标)。
    • 输出:ATE, ATT, ATC, CATE(x) 及不确定度 U = k * u_c,平衡与重叠报告、manifest.stats.causal.*。

II. 名词与变量


III. 公设 P310-*


IV. 最小方程 S310-*

  1. S310-1(目标量)
    ATE = E[ Y(1) - Y(0) ];ATT = E[ Y(1) - Y(0) | T=1 ];ATC = E[ Y(1) - Y(0) | T=0 ]。
  2. S310-2(IPW 估计,归一版)
    • mu1 = ( ∑ T_i * Y_i / e_hat(X_i) ) / ( ∑ T_i / e_hat(X_i) );
    • mu0 = ( ∑ (1-T_i) * Y_i / ( 1 - e_hat(X_i) ) ) / ( ∑ (1-T_i) / ( 1 - e_hat(X_i) ) );
    • ATE_IPW = mu1 - mu0。
  3. S310-3(双稳健 AIPW)
    ATE_DR = ( 1 / n ) * ∑ [ m1_hat(X_i) - m0_hat(X_i) + T_i * ( Y_i - m1_hat(X_i) ) / e_hat(X_i) - (1-T_i) * ( Y_i - m0_hat(X_i) ) / ( 1 - e_hat(X_i) ) ]。
  4. S310-4(匹配与平衡)
    最近邻匹配 match(s_i) 保证 SMD_k ≤ tol_smd;匹配后差值 ATE_match = ( 1 / n_m ) * ∑ ( Y_i - Y_{j(i)} )。
  5. S310-5(IV:Wald 与 2SLS)
    • 二元 Z 的 LATE:LATE = ( E[Y|Z=1] - E[Y|Z=0] ) / ( E[T|Z=1] - E[T|Z=0] )。
    • 2SLS:beta_2SLS = ( X' P_Z X )^{-1} X' P_Z Y,其中 X = [1, T, W],W 为协变量。
  6. S310-6(不确定度与稳健方差)
    • 线性化/三明治方差:Var_hat( beta ) = ( X' P_Z X )^{-1} ( X' P_Z hat{u} hat{u}' P_Z X ) ( X' P_Z X )^{-1};
    • 重抽样:U = k * u_c 对应 BCa/自助法区间。
  7. S310-7(重叠与权重稳定)
    W_norm = ( ∑ w ) / n ≈ 1;var(w) ≤ tol_wvar;ESS ≥ ESS_min。
  8. S310-8(条件效应)
    CATE(x) = E[ Y(1) - Y(0) | X=x ],以分层或局部回归估计,保留 smoothed_CATE(x) 与区间。
  9. S310-9(时间一致与到达时)
    窗口化估计:ATE(Delta_t) = ( 1 / |W| ) * ∑_{i∈W} tau_i;涉及 T_arr 的指标需并行两口径并记录 delta_form。

V. 统计流程 M30-10(就绪→估计→诊断→发布)


VI. 契约与断言 C30-101x


VII. 实现绑定 I30-*

不变量:sum(weights)/n ≈ 1;ESS ≥ ESS_min;contract_report.pass == true 方可发布;TraceID 与版本签名齐备。


VIII. 交叉引用


IX. 质量与风控


小结

本章确立 PS/IPW/DR/IV 的统一识别—估计—诊断—发布闭环,以 C30-101x 契约约束重叠与平衡、到达时一致与审计可追溯,产出 ATE/ATT/CATE 及其不确定度并可在漂移中稳健运行。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/