目录文档-技术白皮书05-EFT.WP.Core.Errors v1.0

第4章 离群检测与数据质量


I. 目标与术语


II. 公设与一般性要求


III. 单变量检测(静态样本)


IV. 多变量检测(相关维)


V. 时序与流式检测


VI. 基于残差与拟合的检测(与第2章、第三章衔接)


VII. 缺失、重复与边界值处理


VIII. 数据质量度量与阈值基线


IX. 复合判决与处置策略


X. 质量控制流程 Mx-2(可执行)


XI. 到达时 T_arr 的路径级离群示例(跨卷锚点)


XII. 实现绑定与接口映射(I50 3)

  1. zscore_detect(x:array, thresh:float=3.5) -> mask:array
    输入:标量序列或列向量;输出:mask_outlier。
  2. mad_scale(x:array) -> float
    返回稳健尺度 s,供 MAD 规则与 IRLS 初始化。
  3. hampel_filter(series:array, k:int, t0:float=3.0) -> mask:array
    滑窗半径 k,阈值 t0。
  4. ransac_fit(model:any, data:any, max_iter:int, tol:float) -> dict
    输出包含 Inliers 索引、theta_hat 与拟合残差统计。
  5. 典型序列:
    • mask1 = zscore_detect(x, 3.5);mask2 = hampel_filter(x_t, k, 3.0);mask = mask1 OR mask2。
    • 以 psi_weight 生成 w,IRLS 再拟合;调用 propagate_error_delta 更新 u_c(y)。
    • attach_traceability(report, chain) 记录证据链与参数源。

XIII. 报告与合规模块(最小字段)


XIV. 本章输出与衔接


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/