目录文档-技术白皮书(V5.05)18-EFT.WP.Methods.CrossStats v1.0

第1章 CrossStats 域定义与范围


一句话目标:定义跨模态统计的一致口径、输入输出与边界,给出最小公设与方程及端到端统计闭环 M30-1 的可执行骨架。


I. 范围与对象

  1. 范围
    • 适用批量数据与事件流的统计描述、估计与检验、序贯与多重比较控制、漂移监测、因果推断与在线实验。
    • 在 tau_mono 上计算统计量,在 ts 上发布,附 offset/skew/J 与到达时两口径差 delta_form。
  2. 输入
    数据集 D = { (x_i, y_i, t_i, w_i, m_i) },其中 w_i 为抽样或逆概率权重,m_i ∈ {0,1} 为缺失掩码;参考分布或历史基线 D_ref;契约与阈值策略 policy。
  3. 输出
    估计与不确定度 {est, SE, CI 或 posterior quantiles};错误控制后的决策与日志;漂移度量 {KL, W1, psi} 与处置建议;因果估计 {ATE, ATT, CATE(x)};manifest.stats.*。
  4. 边界条件
    量纲一致 check_dim(expr) 通过;时间单调 non_decreasing(tau_mono);两口径与 delta_form 记录完整;键与追溯满足 TraceID 与 signature。

II. 名词与变量


III. 公设 P301-*


IV. 最小方程 S301-*


V. 统计流程 M30-1(总闭环)

  1. 就绪条件
    • 输入 D 完成模式绑定与单位修复(见《Methods.Cleaning v1.0》第3/4章),时间轴对齐(见第5章),缺失治理与掩码 m_i 完整(见第7章)。
    • 指定统计窗口 Delta_t、抽样设计与权重策略、契约与阈值 policy。
  2. 操作
    • 生成或导入 w_i 并归一;计算核心统计量与不确定度;必要时执行多重比较或序贯控制。
    • 到达时相关任务并行计算两口径与 delta_form。
  3. 校核
    量纲校核、时基与窗口一致性、权重归一与极值、覆盖度/功效与漂移阈值。
  4. 落盘
    输出估计、区间/后验、决策与告警;生成 manifest.stats.* 并签名冻结。

VI. 契约与断言(示例 C30-1x)


VII. 实现绑定 I30-*(本章锚点)

不变量:sum(w_i)/N ≈ 1;n_eff > 0;non_decreasing(tau_mono);delta_form ≤ tol_Tarr。


VIII. 交叉引用


IX. 质量度量与风控


小结

本章给出 CrossStats 的对象、符号、最小公设与方程,并定义端到端闭环 M30-1 与契约基线。后续章节在此基础上,展开采样设计、估计与区间、错误控制、漂移与因果、实验与审计的实现与发布规范。

版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05