目录文档-技术白皮书15-EFT.WP.Methods.Falsification v1.0

第6章 证伪算子与自动化框架


I. 范围与目标


II. 术语与符号

  1. 算子与预算
    • 输入级算子:mutate(x; op, budget),如 noise, blur, occlude, synonym, prompt_shift。
    • 模型级算子:gradient_attack, weight_jitter, quantize_jitter(qbits),drop_layer(k)。
    • 流水线级算子:delay(dt),jitter(sigma),drop(rate),reorder(k),clock_skew(alpha,beta)。
    • 距离与投影:B_p(x, epsilon)(l_p 球),投影 Pi_{B_p};步长 eta;迭代步 attack_steps。
  2. 注入点与图
    Inject@Input,Inject@Preproc,Inject@Model,Inject@Postproc,Inject@IO;运行图节点以 Graph.sig 标注签名。
  3. 随机与确定性
    rng.seed,rng_family;确定性执行 deterministic = true/false;非确定性屏蔽记录 NonDetMask。

III. 公设与最小方程


IV. 数据与清单口径

  1. Op.card(最小字段)
    • {id, layer ∈ {input, model, pipeline}, threat_model, domain, constraints, params, rng_family, determinism, cost_model, safety_guard}。
    • threat_model 示例:epsilon_linf, epsilon_l2, semantic_edit, timing_fault。
    • constraints 明示 check_dim(expr)、取值域、FDR/FWER 联动策略。
  2. Inject.graph
    {nodes, edges, inject_points[ {node_id, hooks, precedence, rollback} ], signature: Graph.sig };hooks 支持 pre, post, around;rollback 提供恢复策略。
  3. Budget.card
    {cpu, gpu, mem, power, walltime, retries, max_fail_rate},与 TS.latency/TS.error 联动触发降级。

V. 算法与实现绑定

  1. 接口扩展(承接 I50-*)
    • I50-11 register_operator(op_card:dict) -> OpHandle
    • I50-12 compose_operators(chain:list[OpHandle]) -> OpChain
    • I50-13 plan_injection(graph:Graph, chain:OpChain, policy:dict) -> InjectionPlan
    • I50-14 execute_injection(rt:Runtime, plan:InjectionPlan, inputs:any) -> Logs
    • I50-15 estimate_gradient(model:any, x:any, method:str, opts:dict) -> grad:any
    • I50-16 perturb_timebase(stream:any, alpha:float, beta:float) -> stream'
    • I50-17 audit_signature(artifact:any) -> {hash:str, fingerprint:str}
    • I50-18 rollback(rt:Runtime, anchor:str) -> Runtime
    • I50-19 enforce_determinism(rt:Runtime, mask:any) -> Runtime
  2. 编排策略(摘要伪代码)
    • op_set ← registry.filter(threat_model, layer)
    • chain ← compose_operators( select(op_set, policy.compat) )
    • plan ← plan_injection(graph, chain, budget ∪ precedence)
    • rt' ← enforce_determinism(rt, NonDetMask);sig ← audit_signature(rt')
    • logs ← execute_injection(rt', plan, inputs)
    • 产出度量:cov_spec, kill_rate, TS.latency, TS.error;若 TS.error > tau_err 或 cov_spec 未提升,则 rollback(rt', anchor)

VI. 计量流程与运行图


VII. 验证与测试矩阵

  1. 算子正确性
    • 对每个 op,执行域内外边界样本三点法;验证 check_dim(expr) 与域约束。
    • 对 gradient_attack,比较 FGSM/PGD/SPSA 在相同 epsilon 下的违例率与方差。
  2. 资源与时序
    • 在 budget.* 约束下压测,记录 TS.latency P50/P95 与 TS.error;超过阈值触发降级。
    • 对 clock_skew 注入,验证 S52-17 的 tau_skew 门限。
  3. 重放与一致性
    固定 rng.seed 重放 3 次,delta_offon ≤ tau_offon;cov_spec 与 kill_rate 变异系数 ≤ tau_cv。
  4. 统计与错误控制
    断言检验进入门控,FDR ≤ q_star 或 FWER ≤ alpha_family;对多算子串联进行家族错误率合成。

VIII. 交叉引用与依赖


IX. 风险、限制与开放问题


X. 交付件与版本管理


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/