目录文档-技术白皮书(V5.05)15-EFT.WP.Methods.Falsification v1.0

第4章 数据与对抗样本口径


I. 范围与目标

  1. 本章定义证伪所需数据资产与对抗样本族之统一口径,覆盖采集、规范化、生成、筛选、指纹、追溯与签名发布,确保在 EnvLock 与共同时基 ts = alpha + beta * tau_mono 下可复现、可取证、可量化比较。
  2. 目标与通过标准
    • 建立样本族 D_family = { D_base, D_neg, D_boundary, D_ood, D_adv, D_mr } 及其生成与验收准则;任一对抗扰动满足预算与可行域约束 x_adv = proj_X( x + delta ),其中 || delta ||_p ≤ epsilon_lp。
    • 样本库以覆盖与杀伤为核心度量:cov_spec = ( |C_hit| / |C_total| ),kill_rate = ( |mut_killed| / |mut_all| );达到预注册门限并通过 FDR 或 FWER 控制的统计检验(见 第3章 S52-*)。

II. 术语与符号


III. 公设与最小方程

  1. P51-4(可行域与量纲守恒公设)
    任一生成样本 x_gen 必位于可行域 X 且满足量纲校核 check_dim(expr);若 x + delta 越界,则以投影 proj_X(·) 回到 X,且记录超界幅度与修正轨迹。
  2. P51-5(形变不变性公设)
    对任一 MR_k,存在不变性质 Inv_k 使 Inv_k( x ) = Inv_k( MR_k(x) );若观测违背该等式,则记为性质断言失败,并进入证伪流程(见 第5章)。
  3. S52-5(对抗扰动预算与成功准则)
    • 预算约束:|| delta ||_p ≤ epsilon_lp,x_adv = proj_X( x + delta )。
    • 成功指标(通用口径二选一):
      1. 标签翻转:argmax f( x_adv ) ≠ argmax f( x )
      2. 损失增量:ΔL = L( y, f( x_adv ) ) - L( y, f( x ) ) ≥ tau_attack
  4. S52-6(OOD 距离与门限)
    设嵌入 z(·) 与度量 dist(·,·),d_ood(x) = min_{x' ∈ D_train} dist( z(x), z(x') );当 d_ood(x) ≥ eta_ood 判作 OOD。eta_ood 由目标 FPR、TPR 与开发集 ROC 校准确定。
  5. S52-7(家族采样配额)
    家族采样分布 pi_family 满足 Σ_j pi_family(j) = 1;执行时期望配额 E[ n_j ] = pi_family(j) * N_total,并以 || \hat{pi} - pi_family ||_1 ≤ tau_mix 作为配比合格准则。

IV. 数据与清单口径


V. 算法与实现绑定

  1. 绑定原型(承接与扩展 I50-*)
    • I50-3 generate_counterexamples(runtime:any, hypothesis:Hypothesis, ops:list, budget:dict) -> CEReport
    • I50-4 metamorphic_transform(x:any, MR:dict) -> x_prime:any
    • I50-5 adversarial_attack(runtime:any, x:any, method:str, eps:dict) -> AttackReport
    • I50-15 build_sample_bank(cards:dict, data:any) -> Bank(构建 D_family 并返回索引)
    • I50-16 filter_ood(data:any, z:any, eta_ood:float) -> {in:list, ood:list}
    • I50-17 balance_sampler(bank:Bank, pi_family:dict, N:int, seed:int) -> Batch
    • I50-18 sign_bank(bank:Bank, anchor:str) -> {fingerprint:str, sig:str}
    • I50-19 verify_budget(batch:Batch, constraints:dict) -> BudgetReport
  2. 幂等与异常
    • 幂等条件:锁定 EnvLock、cards、seed 与 anchor 时,build_sample_bank 输出的 fingerprint 不变。
    • 可能异常:E_SCHEMA_MISMATCH,E_DIMENSION_MISMATCH,E_PRIVACY_VIOLATION,E_RESOURCE_EXCEEDED,E_NONDETERMINISM。

VI. 计量流程与运行图

  1. Mx-55 数据入湖与规范化
    校核 DataCard → 执行 preprocess → 记录 hash(dataset) 与 timebase{alpha,beta} → check_dim(expr) 全量通过。
  2. Mx-56 样本生成与约束验证
    生成 D_neg/D_boundary(边界值与约束模糊),D_mr(应用 MR_k),D_adv(adversarial_attack)→ verify_budget 保证 || delta ||_p ≤ epsilon_lp 与 proj_X 可行。
  3. Mx-57 OOD 筛选与隐私审查
    计算 d_ood(x) 并以 eta_ood 划分 → 触发 pi_family 回补策略 → PII/合规扫描与脱敏。
  4. Mx-58 样本库签名与发布
    sign_bank 产出 {fingerprint, sig} → 生成 Coverage.report、KillRate.report、OOD.eval → 发布至证据包并登记 anchor。
  5. 运行观测点与回退
    • 观测:TS.latency(生成延迟)、TS.error(生成失败率)、budget.*(资源开销)。
    • 回退:若 || \hat{pi} - pi_family ||_1 > tau_mix 或 epsilon 违规,回滚至上一签名版本并降级生成策略(如降低 steps 或切换 method)。

VII. 验证与测试矩阵

  1. 合规最小用例
    • 预算校核:随机抽样 x,验证 max_p || delta ||_p ≤ epsilon_lp 与 x_adv ∈ X。
    • 形变不变性:对每个 MR_k,抽检 Inv_k(x) = Inv_k(MR_k(x)) 失败率不超过预注册阈值。
    • OOD 门限:在标注开发集上 TPR@FPR=tau_fpr 达标。
  2. 覆盖与杀伤
    • 规格覆盖:cov_spec ≥ tau_cov。
    • 杀伤率:kill_rate ≥ tau_kill,并给出 power 区间或 bootstrap 置信带 1 - delta。
  3. 稳定性与再现
    重放 R=3 次:fingerprint 不变;attack_success_rate 变异系数低于 tau_cv;离线/在线生成在 ts 对齐下差异 delta_offon ≤ tau_offon。

VIII. 交叉引用与依赖


IX. 风险、限制与开放问题


X. 交付件与版本管理


版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05