目录 / 文档-技术白皮书 / 54-复现实验清单 Template v1.0
I. 目标与范围(Purpose & Scope)
- 给出从环境拉起到结果核对的端到端可执行流程:预检→数据核验→训练→推理→对齐→评测与区间→对比与放行→打包与签名,确保一次运行可复现、产物可校验、决策可审计。
- 凡涉及路径量(到达时/相位),正文显式 gamma(ell) 与测度 d ell;数据侧记录 delta_form ∈ {general, factored};所有表达括号化;发布要求 p_dim = 1.0 并随附 check_dim_report.json。
II. 输入与依赖(Prerequisites & Inputs)
- 依赖:第4章(环境锁定)、第5章(数据快照与血缘)、第6章(权重/参数/新鲜度)、第7章(脚本与命令)、第8章(种子/随机性/确定性)、第9章(指标/区间/门)。
- 引用口径统一“卷名 + 版本 + 锚点(P/S/M/I)”,锚点直指率 ≥ 90%;跨卷 coverage.mode ∈ {k, alpha, quantile} 一致。
III. 流程总览(E2E Flow)
- Preflight:校验 env_lock.json / container_spec.yaml / seed_policy.yaml,输出 preflight_report.json。
- Data Verify:核对 data_refs.yaml / split_manifest.json / lineage_graph.json / checksums.txt,输出 data_verify.json。
- Train:按 train_config.yaml 执行,产出 weights/best.ckpt 与日志;记录 rng_state.json。
- Infer:按 binding_spec.md / inference_openapi.yaml / inference.proto 执行推理,产出 outputs/preds.json。
- Align(时间→路径→相位):校齐 gamma_ell/d_ell/n_eff,回显 delta_form 元数据。
- Eval & UQ:执行 bench_plan.yaml,计算指标点+区间,产出 scorecard.json / uq_summary.json。
- Compare & Validate:依据 compare_spec.yaml 生成 validate_report.json,对照门阈与容忍判定放行。
- Pack & Sign:更新 report_manifest.yaml,生成 checksums.txt / SIGNATURE.asc,归档到 PTN_EXPORT/。
IV. 关键对齐(时间→路径→相位)
- 时间对齐:窗口/水位与 clock_state="locked";|ts_start − calib.timestamp| ≤ τ_calib。
- 路径对齐:数组同长 len(gamma_ell)=len(d_ell)=len(n_eff)≥2,步长 Δell ≤ ( c_ref / f_s ) / max(n_eff)。
- 相位对齐:在参考窗内评估相位与相关/一致性指标。
- 统一口径(两式等价):
T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell )
T_arr = ( ∫ ( n_eff / c_ref ) d ell )
相位:Phi = ( 2π / λ_ref ) * ( ∫ n_eff d ell )。
V. 执行细则(Executable Steps)
- 预检命令:make preflight 或 ./reproduce.sh preflight;失败即停止并写 audit.jsonl。
- 数据核验:make data_verify;校验 Schema/切分/血缘/校验和。
- 训练:make train IDK=<idempotency_key>;保存 best.ckpt/last.ckpt 和 reports/train.log。
- 推理:make infer IDK=<idempotency_key>;产出 outputs/preds.json 与路径元数据。
- 评测与区间:make eval;写 eval/scorecard.json、区间与收敛曲线。
- 对比与放行:make compare;生成 reports/validate_report.json 与最终决策 pass|fail|[Restricted]。
- 打包签名:make pack;更新 report_manifest.yaml、写入 checksums.txt / SIGNATURE.asc。
VI. 产物与日志(Artifacts & Logs)
- 必出:preflight_report.json / data_verify.json / best.ckpt / preds.json / scorecard.json / uq_summary.json / validate_report.json / report_manifest.yaml / checksums.txt / SIGNATURE.asc / audit.jsonl。
- 图表:figs/metric_curves.{pdf,png}、figs/interval_bands.{svg,png}、figs/path_profile.pdf(双份导出,图注含单位与覆盖模式)。
VII. 放行判定(Release Decision)
- 通过:/validate 核验 G1–G8 全部通过,且关键指标(点+区间)满足 compare_spec.yaml 阈值与容忍。
- 限制发布:任一核心门失败或区间不重叠 → [Restricted]:仅发布定性图表与诊断说明。
- 阻断:维度闭合失败(p_dim < 1.0)或时间锁定违例,立即停止并回退。
VIII. 质量门映射(Gates Mapping)
- G1 Schema 完整|G2 引用合规|G3 路径规范|G4 量纲闭合|G5 新鲜度|G6 覆盖一致|G7 协方差一致|G8 唯一性与无环。
- 触发 S1–S5(量纲/新鲜度/路径/协方差/引用)即停止后续阶段并记录审计。
IX. 机读配置(Machine-Readable Configs)
A. eval/compare_spec.yaml(节选)
version: "1.0.0"
coverage: { mode: "k", k: 2 } # k|alpha|quantile
metrics:
mae: { tolerance: 1.0e-4 }
auc: { tolerance: 2.0e-3 }
r_phi: { lb95_min: 0.60 }
delta_t_arr_s: { guard: "tau_T_s" }
epsilon_flux_p95: { guard: 0.02 }
latency_p95_s: { guard: 0.200 }
rules:
interval_overlap_required: true
same_coverage_band_required: true
B. tools/compare.py 输出(示例)
{
"decision": "pass",
"deltas": { "MAE": 1.0e-5, "Latency_P95_s": 0.006 },
"intervals": { "r_phi_ref":[0.61,0.80], "r_phi_repro":[0.62,0.79], "overlap": true },
"gates": { "G1": true, "G2": 0.94, "G3": true, "G4": true, "G5": true, "G6": true, "G7": true, "G8": true }
}
X. 反例与修正(Anti-Patterns & Fixes)
- 反例:仅报均值不报区间 → 修正:补充 U = k·u_c 或分位带与收敛诊断。
- 反例:T_arr = ∫ n_eff / c_ref d ell(无括号) → 修正:括号化为统一口径。
- 反例:未回显 delta_form 或路径数组不同长 → 修正:对齐环节补齐并校齐长度。
- 反例:跨卷覆盖模式不一致 → 修正:统一为单一 coverage.mode 并在清单与图注声明。
- 反例:恢复训练后产物 sha256 改变 → 修正:恢复 RNG/优化器/AMP 状态并重算校验。
XI. 交叉引用(Cross-References)
- 第3章(目录与制品)、第4章(环境锁定)、第5章(数据快照)、第6章(权重/参数)、第7章(脚本与命令)、第8章(种子与确定性)、第9章(指标与门)。
- 《模型卡》Ch.6/Ch.7/Ch.8/Ch.10/Ch.12;《误差预算卡》Ch.8/Ch.9;《数据集卡》Ch.11;《管线卡》Ch.12。
XII. 勾选清单(Checklist)
- preflight → data_verify → train → infer → align → eval → compare → pack 全流程一次跑通,所有产物 sha256 记录完备。
- 路径对齐显式 gamma/measure/delta_form;len(path) ≥ 2、Δell 合规;相位在参考窗内评估;p_dim = 1.0。
- 指标点+区间满足 compare_spec.yaml 容忍/阈值;收敛诊断完备;跨平台仍处于同一覆盖区间。
- /validate 通过 G1–G8;report_manifest.yaml / checksums.txt / SIGNATURE.asc 已更新;audit.jsonl 记录完整。
- 不合规项按 [Restricted] 标注与处置,出具诊断与修复路径。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/