目录 / 文档-技术白皮书 / 18-EFT.WP.Methods.CrossStats v1.0
一句话目标:在非随机试验与跨域场景下,基于倾向评分、逆概率加权、双稳健与工具变量建立可审计的 ATE/ATT/CATE 估计闭环,并以契约保证重叠性、平衡性与时基一致。
I. 范围与对象
- 范围
- 适用于二分类处理 T ∈ {0,1} 与多分类/连续处理的线性近似;覆盖离线与在线流式估计、跨域迁移与随时间漂移。
- 支持配对/最近邻匹配、加权(IPW/稳定权重/截尾)、回归调整、双稳健(AIPW/TMLE)与工具变量(IV/2SLS/局部平均处理效应)。
- 对象
- 输入:D = { (X_i, T_i, Y_i, ts_i) }、模型族与正则策略、窗口 Delta_t、时基 tau_mono、到达时参数(如使用 T_arr 指标)。
- 输出:ATE, ATT, ATC, CATE(x) 及不确定度 U = k * u_c,平衡与重叠报告、manifest.stats.causal.*。
II. 名词与变量
- 潜在结局:Y(1), Y(0);处理 T;协变量 X;倾向评分 e(x) = P(T=1|X=x)。
- 回归函数:m_t(x) = E[ Y | T=t, X=x ];残差 r_t = Y - m_t(X)。
- 权重:w_IPW = T / e_hat(X) + (1-T) / ( 1 - e_hat(X) );稳定权重 w_stab = ( T * p_T + (1-T) * (1-p_T) ) / ( T * e_hat + (1-T) * (1-e_hat) )。
- 工具变量:Z;投影矩阵 P_Z = Z ( Z' Z )^{-1} Z'。
- 诊断:SMD_k(标准化均值差)、ESS = ( ∑ w )^2 / ∑ w^2、overlap = min(e_hat), max(e_hat)。
III. 公设 P310-*
- P310-1(可交换性/背门):若采用 PS/IPW/DR,需 Y(t) ⟂ T | X 与正则重叠 0 < P(T=1|X) < 1。
- P310-2(工具变量基线):若采用 IV,需要相关性 Cov(Z,T|X) ≠ 0、排除限制 Z ⟂ Y(t) | X、独立性 Z ⟂ {Y(0),Y(1)} | X、单调性(用于 LATE)。
- P310-3(时基一致):估计窗口在 tau_mono,发布以 ts;处理先于结局,禁止因果方向反转。
- P310-4(量纲与单位):unit(Y) 与 unit(T) 明确;check_dim( Y - f(T,X) ) 通过。
- P310-5(重叠守护):对 e_hat 实施截尾 eps_e ≤ e_hat ≤ 1 - eps_e 或倾向分层。
- P310-6(可回退与审计):每次更新输出 TraceID、权重分布、平衡面板与合同化阈值。
IV. 最小方程 S310-*
- S310-1(目标量)
ATE = E[ Y(1) - Y(0) ];ATT = E[ Y(1) - Y(0) | T=1 ];ATC = E[ Y(1) - Y(0) | T=0 ]。 - S310-2(IPW 估计,归一版)
- mu1 = ( ∑ T_i * Y_i / e_hat(X_i) ) / ( ∑ T_i / e_hat(X_i) );
- mu0 = ( ∑ (1-T_i) * Y_i / ( 1 - e_hat(X_i) ) ) / ( ∑ (1-T_i) / ( 1 - e_hat(X_i) ) );
- ATE_IPW = mu1 - mu0。
- S310-3(双稳健 AIPW)
ATE_DR = ( 1 / n ) * ∑ [ m1_hat(X_i) - m0_hat(X_i) + T_i * ( Y_i - m1_hat(X_i) ) / e_hat(X_i) - (1-T_i) * ( Y_i - m0_hat(X_i) ) / ( 1 - e_hat(X_i) ) ]。 - S310-4(匹配与平衡)
最近邻匹配 match(s_i) 保证 SMD_k ≤ tol_smd;匹配后差值 ATE_match = ( 1 / n_m ) * ∑ ( Y_i - Y_{j(i)} )。 - S310-5(IV:Wald 与 2SLS)
- 二元 Z 的 LATE:LATE = ( E[Y|Z=1] - E[Y|Z=0] ) / ( E[T|Z=1] - E[T|Z=0] )。
- 2SLS:beta_2SLS = ( X' P_Z X )^{-1} X' P_Z Y,其中 X = [1, T, W],W 为协变量。
- S310-6(不确定度与稳健方差)
- 线性化/三明治方差:Var_hat( beta ) = ( X' P_Z X )^{-1} ( X' P_Z hat{u} hat{u}' P_Z X ) ( X' P_Z X )^{-1};
- 重抽样:U = k * u_c 对应 BCa/自助法区间。
- S310-7(重叠与权重稳定)
W_norm = ( ∑ w ) / n ≈ 1;var(w) ≤ tol_wvar;ESS ≥ ESS_min。 - S310-8(条件效应)
CATE(x) = E[ Y(1) - Y(0) | X=x ],以分层或局部回归估计,保留 smoothed_CATE(x) 与区间。 - S310-9(时间一致与到达时)
窗口化估计:ATE(Delta_t) = ( 1 / |W| ) * ∑_{i∈W} tau_i;涉及 T_arr 的指标需并行两口径并记录 delta_form。
V. 统计流程 M30-10(就绪→估计→诊断→发布)
- 就绪
清洗与时基对齐(tau_mono)、定义窗口 Delta_t、声明目标量与约束;评估重叠性与缺失机制。 - 倾向与结局建模
拟合 e_hat(X)(逻辑回归/GBDT),约束校准与截尾;拟合 m0_hat, m1_hat(GLM/树/神经网络)。 - 估计
计算 ATE_IPW 与 ATE_DR;如违反可交换性则启用 IV/2SLS 或前门路径。 - 诊断与校核
报告 SMD_k、ESS、W_norm/var(w)、覆盖度/区间、灵敏度分析(如 Gamma/E-value 摘要)。 - 发布与落盘
生成 manifest.stats.causal.*(目标量、方法、阈值、面板、TraceID、回退策略),对外 ts 发布。
VI. 契约与断言 C30-101x
- C30-1011(重叠):eps_e ≤ e_hat(X_i) ≤ 1 - eps_e;ESS ≥ ESS_min;max(w) ≤ w_max。
- C30-1012(平衡):匹配/加权后 max_k SMD_k ≤ tol_smd;分层内 KS_p ≥ p_min。
- C30-1013(权重稳定):W_norm ≈ 1 且 var(w) ≤ tol_wvar。
- C30-1014(覆盖度与区间):CI_coverage_p95 ≥ SLO_cover 或后验分位满足 U = k * u_c。
- C30-1015(IV 相关性与排除):第一阶段 F_stat ≥ 10;过度识别检验 p ≥ p_min;记录单调性声明。
- C30-1016(时基与因果顺序):T 发生时间 < Y 评估时间;若使用 T_arr,断言 delta_form ≤ tol_Tarr。
- C30-1017(回退):若 tol_smd 或 ESS_min 失败,回退为分层估计或报告不可识别并阻塞发布。
VII. 实现绑定 I30-*
- I30-101 estimate_ate(ds, method, params) -> {ATE, U, report}(method ∈ {IPW, DR, MATCH, 2SLS})
- I30-102 fit_propensity(ds, model_spec, calib) -> e_hat
- I30-103 match_ps(ds, scheme, caliper) -> pairs
- I30-104 dr_estimator(ds, e_hat, m0_hat, m1_hat) -> ATE_DR
- I30-105 iv_2sls(Y, T, Z, W) -> {beta_2SLS, V_hat}
- I30-106 balance_report(ds, weights) -> {SMD_k, ESS, W_norm, var_w}
- I30-107 evaluate_causal_contracts(report, rules) -> contract_report
- I30-108 time_align_for_stats(ds, sync_ref) -> ds'(携带 offset/skew/J 与 T_arr 两口径)
- I30-109 emit_causal_manifest(results, policy) -> manifest.stats.causal
不变量:sum(weights)/n ≈ 1;ESS ≥ ESS_min;contract_report.pass == true 方可发布;TraceID 与版本签名齐备。
VIII. 交叉引用
- 倾向建模与权重归一:见本卷第3章。
- 多重比较与序贯预算(多指标/多窗口推断):见本卷第6章。
- 漂移触发与基线更新:见本卷第7章。
- A/B 与停序规则(因果估计上线闸门):见本卷第8章。
- 时基与到达时两口径:见《Methods.Cleaning v1.0》第5、6章。
IX. 质量与风控
- SLI/SLO(示例)
max_k SMD_k ≤ 0.1;ESS ≥ 100;CI_coverage_p95 ≥ 0.9;latency_ms_p99 ≤ SLO_latency;retrain_interval_days ≤ 30。 - 风控策略
重叠不足:执行截尾与分层回退;IV 弱工具:报警并阻塞;权重爆炸:切换稳定权重或 DR;时基违规:回滚并纠偏 offset/skew/J。
小结
本章确立 PS/IPW/DR/IV 的统一识别—估计—诊断—发布闭环,以 C30-101x 契约约束重叠与平衡、到达时一致与审计可追溯,产出 ATE/ATT/CATE 及其不确定度并可在漂移中稳健运行。版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/