目录 / 文档-技术白皮书(V5.05) / 15-EFT.WP.Methods.Falsification v1.0
I. 范围与目标
- 本章统一证伪领域的核心术语,建立五层对象模型 Env/Data/Model/Runtime/Metrics,明确可观察量与可控量边界,规范跨层接口与签名口径,支撑全书 P51-* / S52-* / Mx-5* / I50-* 的一致实现与审计可追溯性。
- 通过标准:
术语无歧义、冲突名零出现;跨层接口以 schema_id 与 anchor 对齐;EnvLock 可复现;任一断言 A 可映射到 observable 与可执行 decision_rule。
II. 术语与符号
- 基础术语
- Hypothesis (H):待检主张,含 H0/H1 与阈值 alpha/beta/delta_equiv。
- Assertion (A):性质断言,函数形式 A(x, y_hat, meta) -> {0,1}。
- Oracle (O):判定器,oracle(y_true, y_pred, meta) -> verdict ∈ {pass, fail, unknown}。
- TestCase (TC):TC = <x, y_true?, A, O, rule>,y_true? 可缺省。
- Metamorphic Relation (MR):MR: x -> x' 与期望关系 R( y_hat, y_hat' )。
- CounterExample (CE):使 A(x, ·) = 0 或触发拒绝域的样本。
- Attack:对抗或变异操作,attack(x; method, eps, steps)。
- GateDecision:GateDecision ∈ {pass, hold, block} 的上线守门结果。
- EvidencePack.sig:证据包及签名,含覆盖、功效、错误控制与运行指标。
- 可观察量与可控量
- O(observables):TS.latency,TS.thrpt,TS.error,p_value,power,FDR。
- U(controls):alpha,beta,q_star,delta_equiv,attack_budget,rng.seed。
- 时基与一致性
统一 ts = alpha + beta * tau_mono;离线/在线一致度 delta_offon = ( norm( y_hat_off - y_hat_on ) / norm( y_hat_off ) ),R_infer = 1 - delta_offon。 - 环境与签名
EnvLock,anchor,schema_id,hash(·),fingerprint,Graph.sig,ParamCard.sig,InferPipelineCard.sig。 - 冲突名与禁用
禁止混用 T_fil 与 T_trans;n 与 n_eff 严格区分;公式与定义统一英文文本符号。
III. 公设与最小方程(与本章相关)
- P51-4(可观察–可控分离公设)
任一决策只依赖 O 与已声明的 U,且 O 的获取不改变其分布。 - S52-5(断言–可观察映射)
存在映射 map: A -> <T(x), C_alpha> 使 decision = [ T(x) ∈ C_alpha ],并满足错误上限 alpha 与功效目标 power >= 1 - beta。 - S52-6(形变一致性)
对任意 MR,若模型满足性质,则 R( y_hat, y_hat' ) = 1;证伪时 CE = { x | R( y_hat, y_hat' ) = 0 }。
IV. 数据与清单口径
- HypothesisRegistry(最小字段)
id,statement,metric,alpha,beta,delta_equiv,family_id,FDR_policy,owner,expiry_ts,anchor。 - AssertionSet(最小字段)
A_k.name,observable,T(x),C_alpha,severity,MR_refs,gate_link,schema_id。 - MR.catalog
MR_k.id,transform,expected_relation,domain,budget,composable ∈ {true,false}。 - AttackRecipe
method,eps = {epsilon_linf, epsilon_l2},steps,targeted ∈ {true,false},budget.cpu/gpu/mem,rng.family/seed。 - 数据追溯与取证
样本与产物均需 fingerprint 与 hash(artifact);日志包含 ts 与 tau_mono 映射参数。
V. 算法与实现绑定(对象层接口)
- Env 层(执行与合规环境)
- 输入:env.spec;输出:EnvLock;异常:E_ENV_MISMATCH。
- 关键函数:I50-Env lock_env(env.spec) -> EnvLock。
- Data 层(数据与生成)
- 输入:schema_id,MR/Attack;输出:dataset | stream;异常:E_SCHEMA_MISMATCH。
- 关键函数:I50-Data generate_cases(MR_or_Attack, budget, schema_id) -> cases。
- Model 层(图与参数)
- 输入:Graph.sig,ParamCard.sig;输出:Runtime.ready;异常:E_MODEL_MISMATCH,E_PRECISION_LOSS。
- 关键函数:I50-Model load_model(anchor) -> Graph。
- Runtime 层(执行通道)
- 输入:Graph,cases,opts;输出:y_hat;异常:E_NONDETERMINISM,E_RESOURCE_EXCEEDED。
- 关键函数:I50-3 run_inference(rt, inputs, opts) -> outputs。
- Metrics 层(计量与决策)
- 输入:A/O/reports;输出:CoverageReport,GateDecision;异常:E_ORACLE_AMBIGUOUS,E_MULTITEST_UNCONTROLLED,E_POWER_INSUFFICIENT。
- 关键函数:I50-8 compute_coverage(logs) -> CoverageReport,I50-9 gate_release(evidence, policy) -> GateDecision。
VI. 计量流程与运行图(Mx-5 摘要)*
- Mx-51 对象就绪
生成或校验 EnvLock → 绑定 schema_id → 校核 AssertionSet 与 MR.catalog 的域与量纲(check_dim(expr))。 - Mx-52 样本生成与执行
generate_cases 产生 TC → run_inference 产出 y_hat → oracle 与 A 裁决。 - Mx-53 统计与守门
计算 p_value/power/FDR 与覆盖 cov_spec、杀伤率 kill_rate → gate_release 产出 GateDecision。 - Mx-54 归档与签名
汇总 EvidencePack.sig,记录 hash(·) 与 anchor,更新 HypothesisRegistry 状态。
VII. 验证与测试矩阵
- 结构正确性
AssertionSet 的每个 A_k 均存在 observable 与 T(x) 映射;MR 可组合性与域声明完备。 - 边界与异常
缺失 schema_id、不匹配的 EnvLock、oracle 返回 unknown 的处理;随机性复现(rng.seed)。 - 一致性与量纲
时基一致:离线重放与线上 ts 对齐;单位检查 check_dim(expr) 通过率 = 100%。
VIII. 交叉引用与依赖
- 《Core.DataSpec》(字段与 schema_id)、《Core.Metrology》(计量与误差口径)、《Core.Threads》(执行与并发)、《Core.Errors》(异常与分级)。
- 《EFT.WP.Methods.Inference》第4章(数据与特征接口)、第5章(模型与算子)、第6章(在线/离线一致性)、第10章(运行与告警)。
IX. 风险、限制与开放问题
- Oracle 歧义导致判决不一致;MR 域越界引入伪反例;跨层接口隐式变更未被 schema_id 捕获;在线流式 FDR 控制的稳健性。
- 开放问题:多租环境下 EnvLock 细粒度划分;跨域 anchor 的等价性证明;A 的自动化可观测映射合成。
X. 交付件与版本管理
- 交付件
HypothesisRegistry.json,AssertionSet.yaml,MR.catalog.yaml,AttackRecipe.yaml,InterfaceMap.md(跨层接口图),EvidencePack.sig.tar。 - 版本策略
语义化版本与通道 canary/stable/LTS;对象变更需更新 schema_id 与 Graph.sig/ParamCard.sig;所有清单绑定 anchor 与 hash(·) 并纳入 EnvLock。
版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05