目录文档-技术白皮书18-EFT.WP.Methods.CrossStats v1.0

第13章 统计合成与元分析(Fixed/Random Effects)


一句话目标:建立从效应量抽取到异质性建模、预测区间与偏倚审计的端到端元分析方法学,并与跨模态计量与时基口径一致化对齐。


I. 范围与对象

  1. 范围
    • 固定效应与随机效应元分析(连续、二分类、率型)。
    • 单变量与多变量(相关效应)合成、元回归与小研究效应诊断。
    • 频率学(DL、REML、HK)与贝叶斯一致化发布。
  2. 对象
    • 输入:D = { study i : (effect e_i, SE_i 或 var v_i, n_i, x_i, ts_i) },或原始对比数据以便换算效应量。
    • 输出:合成效应 hat{theta}, 置信/后验区间,预测区间,异质性度量 {Q, tau^2, I^2}, 偏倚与敏感性报告,manifest.stats.meta.*。
    • 时基:窗口化统计在 tau_mono 上计算,对外以 ts 发布并附 offset/skew/J;若研究含到达时量 T_arr,同步记录两口径与 delta_form。

II. 名词与变量


III. 公设 P313-*


IV. 最小方程 S313-*

  1. S313-1(固定效应合成)
    • 权重:w_i = 1 / v_i;合成:hat{theta}_FE = ( ∑ w_i e_i ) / ( ∑ w_i )。
    • 方差:Var( hat{theta}_FE ) = 1 / ( ∑ w_i )。
  2. S313-2(异质性统计量)
    • Q = ∑ w_i ( e_i - hat{theta}_FE )^2,df = k - 1。
    • I^2 = max( 0, ( Q - df ) / Q )。
  3. S313-3(随机效应:DL 与 REML)
    • DL 估计:tau^2_DL = max( 0, ( Q - df ) / ( ∑ w_i - ( ∑ w_i^2 ) / ( ∑ w_i ) ) )。
    • REML 通过最大化 logL_REML( tau^2 ) 数值求解。
    • 随机权重:w_i* = 1 / ( v_i + tau^2 );合成:hat{theta}_RE = ( ∑ w_i* e_i ) / ( ∑ w_i* )。
    • 方差:Var( hat{theta}_RE ) = 1 / ( ∑ w_i* );Hartung–Knapp 修正以 t_{df} 替代正态并调整方差。
  4. S313-4(预测区间)
    PI = hat{theta}_RE ± t_{k-2,1-α/2} * sqrt( Var( hat{theta}_RE ) + tau^2 )。
  5. S313-5(元回归)
    • 模型:e_i = x_i' beta + u_i + eps_i,u_i ~ N(0, tau^2), eps_i ~ N(0, v_i)。
    • 估计:加权 GLS 或 REML;协变量中心化以稳定数值。
  6. S313-6(多变量元分析)
    e_i ∈ R^p,Cov(e_i) = V_i + tau^2 Σ;采用 GLS/REML 或贝叶斯分层求解。
  7. S313-7(合并 P 值)
    Fisher:X = -2 ∑ log p_i ~ chi2_{2k};Stouffer:Z = ( ∑ w_i z_i ) / sqrt( ∑ w_i^2 )。

V. 统计流程 M30-13(就绪→换算→估计→诊断→发布)


VI. 契约与断言 C30-131x


VII. 实现绑定 I30-*

不变量:sum(w_i)/k ≈ mean(1/v_i)(抽查);theta 与区间可重现;manifest.stats.meta.signature 已签名。


VIII. 交叉引用


IX. 质量与风控

  1. SLI/SLO
    • contract_pass_rate ≥ 0.99;latency_ms_p99 ≤ 1000;reproducibility_hash 一致。
    • 报告完整度:meta_report_completeness ≥ 0.98(必须字段覆盖)。
  2. 风险与回退
    • k 小或 I^2 极大:报告 PI 与稳健估计(HK/贝叶斯),必要时仅发布描述统计并标记“研究不足”。
    • 严重漏斗不对称:触发敏感性(修剪-填充、对数/平方根变换、强先验约束)与再分析计划。
    • 极端权重:对 w_i 设 cap 与稳健权重(如 Huber 权重),并记录策略卡。

小结

本章确立 S313-* 的元分析基式与从就绪到发布的 M30-13 闭环,结合 C30-131x 契约确保异质性、口径与偏倚诊断全面可审计;固定与随机并行产出、预测区间与清单签名,使跨模态统计合成在计量与时基上与全栈规范一致。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/