目录文档-技术白皮书18-EFT.WP.Methods.CrossStats v1.0

第1章 CrossStats 域定义与范围


一句话目标:定义跨模态统计的一致口径、输入输出与边界,给出最小公设与方程及端到端统计闭环 M30-1 的可执行骨架。


I. 范围与对象

  1. 范围
    • 适用批量数据与事件流的统计描述、估计与检验、序贯与多重比较控制、漂移监测、因果推断与在线实验。
    • 在 tau_mono 上计算统计量,在 ts 上发布,附 offset/skew/J 与到达时两口径差 delta_form。
  2. 输入
    数据集 D = { (x_i, y_i, t_i, w_i, m_i) },其中 w_i 为抽样或逆概率权重,m_i ∈ {0,1} 为缺失掩码;参考分布或历史基线 D_ref;契约与阈值策略 policy。
  3. 输出
    估计与不确定度 {est, SE, CI 或 posterior quantiles};错误控制后的决策与日志;漂移度量 {KL, W1, psi} 与处置建议;因果估计 {ATE, ATT, CATE(x)};manifest.stats.*。
  4. 边界条件
    量纲一致 check_dim(expr) 通过;时间单调 non_decreasing(tau_mono);两口径与 delta_form 记录完整;键与追溯满足 TraceID 与 signature。

II. 名词与变量


III. 公设 P301-*


IV. 最小方程 S301-*


V. 统计流程 M30-1(总闭环)

  1. 就绪条件
    • 输入 D 完成模式绑定与单位修复(见《Methods.Cleaning v1.0》第3/4章),时间轴对齐(见第5章),缺失治理与掩码 m_i 完整(见第7章)。
    • 指定统计窗口 Delta_t、抽样设计与权重策略、契约与阈值 policy。
  2. 操作
    • 生成或导入 w_i 并归一;计算核心统计量与不确定度;必要时执行多重比较或序贯控制。
    • 到达时相关任务并行计算两口径与 delta_form。
  3. 校核
    量纲校核、时基与窗口一致性、权重归一与极值、覆盖度/功效与漂移阈值。
  4. 落盘
    输出估计、区间/后验、决策与告警;生成 manifest.stats.* 并签名冻结。

VI. 契约与断言(示例 C30-1x)


VII. 实现绑定 I30-*(本章锚点)

不变量:sum(w_i)/N ≈ 1;n_eff > 0;non_decreasing(tau_mono);delta_form ≤ tol_Tarr。


VIII. 交叉引用


IX. 质量度量与风控


小结

本章给出 CrossStats 的对象、符号、最小公设与方程,并定义端到端闭环 M30-1 与契约基线。后续章节在此基础上,展开采样设计、估计与区间、错误控制、漂移与因果、实验与审计的实现与发布规范。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/