目录文档-技术白皮书48-实验协议卡 Template v1.0

第11章 结果页与对比评分(协议产出)


I. 目的与范围(Purpose & Scope)


II. 结果页必填(Required Items)

  1. 方法与数据标识:dataset_id、method_id、baseline_id、版本(SemVer)、随机种子、观测时间窗。
  2. 核心指标(Primary Metrics)
    • 到达时残差 ΔT_arr (s):T_arr(obs) − T_arr(ref),报告 mean±U(k) 与直方/核密度。
    • 相位一致性 r_phi (1):corr(Phi_ref, Phi_obs),区间用 Fisher–z 变换后还原。
    • 近轴守恒误差 ε_flux (1):→ 0 @ O(θ^2)。
    • 量纲闭合率 p_dim (1):通过率。
    • 稳健残差指标 Q_res (1):越小越好(稳健分位差或 Huber 代理)。
  3. 次级指标(Secondary Metrics):质量守恒偏差 ΔM、相干窗适配度 κ_coh 等。
  4. 到达时/相位统一口径(展示)
    • T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell ) 或 T_arr = ( ∫ ( n_eff / c_ref ) d ell );
    • Phi = ( 2π / λ_ref ) * ( ∫ n_eff d ell );正文显式 gamma(ell) 与 d ell。
  5. 合规模块:check_dim_report.json 摘要、anchor_coverage、ver_presence、clock_state、τ_calib。

III. 对比与评分(Comparators & Scoring)

  1. 基准与对照:给出 baseline_id/version、数据切分与分层(batch/device/region)。
  2. 成对比较:按 record_id 计算 Δm = m_method − m_base;核心指标用配对或置换检验;多重比较用 FDR ≤ 0.1。
  3. 标准化与映射
    • Z-规范化:z_m = ( m − m_baseline ) / σ_baseline;
    • Sigmoid 得分:q_m = 1 / ( 1 + exp( a z_m + b ) )(默认 a=1, b=0,必要时方向取反)。
  4. 组合总分:Q = ( ∑_i w_i q_{m_i} ) / ( ∑_i w_i );w_i 在评测清单中固定。
  5. 判定门槛(与第8章对齐)
    • 阳性:核心门全部过阈(如 |ΔT_arr| ≤ τ_T、r_phi ≥ 0.6、p_dim = 1.0),且 Q ≥ Q_base + δQ_min;
    • 阴性:任一核心门失败或引用/量纲不合规。

IV. 可视化规范(Visualization Standards)


V. 评分卡导出(Scorecard Export)

{

"version": "1.0.0",

"dataset_id": "ptn-demo",

"baseline": { "id": "base-001", "version": "1.2.3" },

"method": { "id": "mA-010", "version": "2.0.0" },

"metrics": {

"DeltaT_arr_s": { "mean": -2.3e-9, "std": 4.8e-9, "U_k2": 1.5e-9 },

"r_phi": { "value": 0.72, "ci95": [0.61, 0.80] },

"epsilon_flux": { "median": 0.004, "p95": 0.011 },

"p_dim": 1.0,

"Q_res": 0.13

},

"score": { "Q": 0.78 },

"tests": {

"paired": { "DeltaT_arr": { "p_perm": 0.004, "B": 10000 } },

"FDR": 0.08

},

"see": [

"EFT.WP.Core.Equations v1.1:S20-1",

"EFT.WP.Core.Metrology v1.0:check_dim",

"Data.Benchmarks v1.0:PROTO"

],

"version_lock": true

}


VI. 发布包与合规(Release Bundle & Compliance)


VII. 机读配置(Machine-Readable)
A. bench_score.yaml(接口契约)

version: "1.0.0"

call: "I90-bench_score"

inputs:

results: "PTN_EXPORT/results.parquet"

baseline: "PTN_EXPORT/baseline.parquet"

metrics: ["DeltaT_arr_s","r_phi","epsilon_flux","p_dim","Q_res"]

weights: { DeltaT_arr_s: 0.35, r_phi: 0.25, epsilon_flux: 0.15, p_dim: 0.15, Q_res: 0.10 }

thresholds:

tau_T_s: "3*u(T_arr)"

r_phi_min: 0.6

flux_ok: "≈0@O(theta^2)"

p_dim: 1.0

mapping:

type: "sigmoid"

a: 1.0

b: 0.0

exports:

files: ["scorecard.json","results.md","figs/*.pdf","reports/check_dim_report.json"]


VIII. 引用与版本(Citations & Versioning)


IX. 执行勾选清单(Checklist)


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/