目录 / 文档-技术白皮书 / 18-EFT.WP.Methods.CrossStats v1.0
第13章 统计合成与元分析(Fixed/Random Effects)
一句话目标:建立从效应量抽取到异质性建模、预测区间与偏倚审计的端到端元分析方法学,并与跨模态计量与时基口径一致化对齐。
I. 范围与对象
- 范围
- 固定效应与随机效应元分析(连续、二分类、率型)。
- 单变量与多变量(相关效应)合成、元回归与小研究效应诊断。
- 频率学(DL、REML、HK)与贝叶斯一致化发布。
- 对象
- 输入:D = { study i : (effect e_i, SE_i 或 var v_i, n_i, x_i, ts_i) },或原始对比数据以便换算效应量。
- 输出:合成效应 hat{theta}, 置信/后验区间,预测区间,异质性度量 {Q, tau^2, I^2}, 偏倚与敏感性报告,manifest.stats.meta.*。
- 时基:窗口化统计在 tau_mono 上计算,对外以 ts 发布并附 offset/skew/J;若研究含到达时量 T_arr,同步记录两口径与 delta_form。
II. 名词与变量
- 效应量:e_i(如 Hedges g、log OR、log RR、Fisher z)、方差 v_i = SE_i^2、权重 w_i。
- 总效应:theta,估计 hat{theta}。
- 异质性:Cochran Q,总体方差 tau^2,比例 I^2 = max( 0, ( Q - (k - 1) ) / Q )。
- 预测区间:PI = hat{theta} ± t_{k-2,1-α/2} * sqrt( V_rand + tau^2 )。
- 元回归:协变量向量 x_i,系数 beta。
- 小研究效应:漏斗不对称统计与回归截距。
III. 公设 P313-*
- P313-1(效应量统一):所有研究在合成前映射到统一效应域与单位,执行 check_dim( e_i ) 与方向一致化。
- P313-2(方差正定):v_i > 0,随机效应 tau^2 ≥ 0;多变量协方差矩阵半正定。
- P313-3(模型可交换性):在随机效应模型下,给定 theta_i ~ N( mu, tau^2 ),各研究条件独立。
- P313-4(时基一致):窗口、对齐与到达时两口径遵循《Methods.Cleaning》第5章与第6章。
- P313-5(发布一致):固定与随机并行估计并报告,两者差异进入审计与策略卡;若涉及 T_arr,记录 delta_form。
IV. 最小方程 S313-*
- S313-1(固定效应合成)
- 权重:w_i = 1 / v_i;合成:hat{theta}_FE = ( ∑ w_i e_i ) / ( ∑ w_i )。
- 方差:Var( hat{theta}_FE ) = 1 / ( ∑ w_i )。
- S313-2(异质性统计量)
- Q = ∑ w_i ( e_i - hat{theta}_FE )^2,df = k - 1。
- I^2 = max( 0, ( Q - df ) / Q )。
- S313-3(随机效应:DL 与 REML)
- DL 估计:tau^2_DL = max( 0, ( Q - df ) / ( ∑ w_i - ( ∑ w_i^2 ) / ( ∑ w_i ) ) )。
- REML 通过最大化 logL_REML( tau^2 ) 数值求解。
- 随机权重:w_i* = 1 / ( v_i + tau^2 );合成:hat{theta}_RE = ( ∑ w_i* e_i ) / ( ∑ w_i* )。
- 方差:Var( hat{theta}_RE ) = 1 / ( ∑ w_i* );Hartung–Knapp 修正以 t_{df} 替代正态并调整方差。
- S313-4(预测区间)
PI = hat{theta}_RE ± t_{k-2,1-α/2} * sqrt( Var( hat{theta}_RE ) + tau^2 )。 - S313-5(元回归)
- 模型:e_i = x_i' beta + u_i + eps_i,u_i ~ N(0, tau^2), eps_i ~ N(0, v_i)。
- 估计:加权 GLS 或 REML;协变量中心化以稳定数值。
- S313-6(多变量元分析)
e_i ∈ R^p,Cov(e_i) = V_i + tau^2 Σ;采用 GLS/REML 或贝叶斯分层求解。 - S313-7(合并 P 值)
Fisher:X = -2 ∑ log p_i ~ chi2_{2k};Stouffer:Z = ( ∑ w_i z_i ) / sqrt( ∑ w_i^2 )。
V. 统计流程 M30-13(就绪→换算→估计→诊断→发布)
- 就绪
源数据校验、时基对齐、缺失与单位检查;统一对照方向(正向化)。 - 效应量与方差换算
连续:g、SE(g);二分类:log OR/log RR;率型:log rate 与曝光量。 - 模型拟合
并行计算 FE 与 RE( DL, REML, HK );进行元回归(如需要);多变量拟合(相关终点)。 - 诊断与敏感性
异质性 {Q, I^2, tau^2};影响度与留一法;小研究效应(回归截距、漏斗图、修剪-填充)。 - 预测与不确定度
输出合成区间与预测区间;可选贝叶斯后验分位与 U = k * u_c 映射。 - 落盘与发布
生成 manifest.stats.meta.*:口径、转换、模型与超参数、诊断、契约评估、TraceID 与 signature。
VI. 契约与断言 C30-131x
- C30-1311(方差正定):min(v_i) > 0,tau^2 ≥ 0,多变量 eigmin(V_i) ≥ 0。
- C30-1312(异质性报告完整):Q, df, I^2, tau^2 均已计算与落盘。
- C30-1313(并行口径):固定与随机两口径均成功;abs( hat{theta}_RE - hat{theta}_FE ) ≤ tol_theta or flag_diff。
- C30-1314(预测区间存在):若 k ≥ 3,必须给出 PI 且 PI_width ≥ PI_min。
- C30-1315(小研究效应检查):当 k ≥ k_egger_min,提供回归检验与决策;若 p < alpha_bias,标记并触发敏感性流程。
- C30-1316(时基与到达时):若研究涉及 T_arr,记录 delta_form 并断言 delta_form ≤ tol_Tarr。
- C30-1317(单位一致):unit(e_i) 与 unit( hat{theta} ) 一致;跨研究转换矩阵落盘可追溯。
VII. 实现绑定 I30-*
- I30-131 compute_effect_sizes(raw, spec) -> {e, v, unit}
- I30-132 meta_fixed(e, v) -> {theta, SE, Q, I2}
- I30-133 meta_random_dl(e, v) -> {theta, SE, tau2, I2}
- I30-134 meta_random_reml(e, v) -> {theta, SE, tau2, I2}
- I30-135 hartung_knapp(e, v, tau2) -> {theta, SE_adj}
- I30-136 meta_regression(e, V, X, method) -> {beta, tau2}
- I30-137 meta_multivariate(E, V_list, method) -> model
- I30-138 bias_diagnostics(e, v) -> {egger_p, trimfill_delta}
- I30-139 leave_one_out(e, v, method) -> influence_report
- I30-13A combine_pvalues(pvals, scheme) -> p_combined
- I30-13B emit_meta_manifest(results, policy) -> manifest.stats.meta
不变量:sum(w_i)/k ≈ mean(1/v_i)(抽查);theta 与区间可重现;manifest.stats.meta.signature 已签名。
VIII. 交叉引用
- 量纲与单位一致化:见《Methods.Cleaning v1.0》第4章。
- 时间轴与同步:见《Methods.Cleaning v1.0》第5章。
- 多层部分汇聚:见本卷第12章。
- 多重比较与错误控制(多终点/亚组):见本卷第6章。
- 成像与物理域口径转换:见《Methods.Imaging v1.0》第4章与第14章。
IX. 质量与风控
- SLI/SLO
- contract_pass_rate ≥ 0.99;latency_ms_p99 ≤ 1000;reproducibility_hash 一致。
- 报告完整度:meta_report_completeness ≥ 0.98(必须字段覆盖)。
- 风险与回退
- k 小或 I^2 极大:报告 PI 与稳健估计(HK/贝叶斯),必要时仅发布描述统计并标记“研究不足”。
- 严重漏斗不对称:触发敏感性(修剪-填充、对数/平方根变换、强先验约束)与再分析计划。
- 极端权重:对 w_i 设 cap 与稳健权重(如 Huber 权重),并记录策略卡。
小结
本章确立 S313-* 的元分析基式与从就绪到发布的 M30-13 闭环,结合 C30-131x 契约确保异质性、口径与偏倚诊断全面可审计;固定与随机并行产出、预测区间与清单签名,使跨模态统计合成在计量与时基上与全栈规范一致。版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/