目录文档-技术白皮书47-PTN Template v1.0

第10章 结果呈现与对比评分


I. 指标定义(Metrics Definition)

  1. 主指标(Primary)
    • 到达时残差:ΔT_arr = T_arr(obs) − T_arr(ref),单位 s;报告 mean(ΔT_arr)、std(ΔT_arr) 与区间 x̂ ± U(覆盖因子 k)。
    • 相位一致性:r_phi = corr( Phi_ref , Phi_obs ),区间用 Fisher z 变换后还原;报告 r_phi 与 p。
    • 守恒误差(近轴):ε_flux(无量纲,→ 0 于 O(θ^2))。
    • 维度闭合率:p_dim ∈ [0,1](通过率)。
    • 稳健残差指标:Q_res ∈ [0,1](越小越好,稳健分位差或 Huber 代理)。
  2. 次指标(Secondary)
    • 质量守恒偏差:ΔM = |∫ ρ dV|_{t2} − |∫ ρ dV|_{t1},单位随 ρ。
    • 路径相干窗适配度:κ_coh = f(T_coh, L_coh, B_coh ; |∇ n_eff|, SNR, σ_y)(无量纲)。
  3. 规范化与得分映射
    • Z-规范化:z_m = ( m − m_baseline ) / σ_baseline。
    • Sigmoid-得分:q_m = 1 / ( 1 + exp( a z_m + b ) )(默认 a=1,b=0,越大越好时按需取反)。
    • 组合总分:Q = ( ∑_i w_i q_{m_i} ) / ( ∑_i w_i ),权重向量 w 在评测清单中固定。
  4. 路径/测度显式
    到达时统一呈现式:
    T_arr = ( ∫ ( n_eff / c_ref ) d ell ) = ( 1 / c_ref ) * ( ∫ n_eff d ell ),正文显式 gamma(ell) 与 d ell,导出记录 delta_form。
  5. 单位与量纲
    任何含除号/积分/复合算符的表达一律加括号;所有变量与符号用反引号;量纲闭合附 check_dim 报告。

II. 基准与对照(Benchmarks & Comparators)

  1. 基准定义
    • 基线模型:baseline_id、版本 baseline.version、训练/标定日期,固定随机种子与配置。
    • 数据切分:train/val/test 或 k-fold;跨设备/天区/批次分层保持均衡。
  2. 对照设置
    • 成对比较:同一记录 record_id 下对比 method_A 与 baseline 的成对差 Δm = m_A − m_base。
    • 统计检验:核心指标采用双侧配对检验或置换检验;多重比较用 Benjamini–Hochberg 控制 FDR ≤ 0.1。
  3. 功效与样本量
    目标功效 1−β=0.9,α_core=0.01;按第 4 章预注册的样本量方案执行。
  4. 评分卡字段(发布版)
    method_id, dataset_id, metrics{ΔT_arr,r_phi,ε_flux,p_dim,Q_res,...}, score.Q, seeds, references[], version。
  5. 判定门槛(与第 4 章对齐)
    • 阳性:核心指标全部过门(如 |ΔT_arr| ≥ τ_T 的改进为负方向、r_phi ≥ 0.6、p_dim=1.0);总分 Q 超过基线 +δQ_min。
    • 阴性:任一核心指标不达标或引用/量纲不合规。

III. 可视化规范(Visualization Standards)

  1. 总览板(Dashboard)
    卡片:ΔT_arr 分布(直方图/核密度)、r_phi 棒图与置信区间、ε_flux 箱线图、Q_res 趋势、p_dim 仪表。
  2. 残差图与一致性图
    • 残差—拟合图:residual vs. fitted;Bland–Altman 图报告均值偏差与 95% 限界。
    • 相位散点:Phi_obs 对 Phi_ref,叠加 y=x 参考线与区间。
  3. 路径与几何
    • 路径剖面:n_eff(ell) 随 ell;图例注明 gamma(ell) 离散步长 Δell 与 delta_form。
    • 近轴守恒:截面能流热力图与 ε_flux 等高线。
  4. 误差条与区间
    所有均值/中位数必须配 ±U 或分位区间;报告 k 或置信水平。
  5. 图表格式
    轴单位显式(s, rad, 1);标注版本与数据时间窗;颜色/线型在图例中固定映射到方法 ID。
  6. 导出
    所有图表以矢量(PDF/SVG)与位图(PNG)双份导出;图注包含 see[] 与 version。

IV. 结论表述(Conclusions & Reporting)

  1. 结论结构
    • 结论一句话:方法相对基线的方向与量级;其后给出核心指标摘要与不确定度。
    • 证据级别:区分统计显著、工程显著与复现状态;同时给出 FDR 调整后的结论。
  2. 限制与边界
    明确适用域(相干窗、近轴、小角、缓变介质等);超域情形标注“限制模式”。
  3. 发布要件
    随附:评分卡 scorecard.json、结果汇总 results.md、审计 audit.jsonl、check_dim_report.json、图表包。
  4. 引用与合规
    统一“卷名 + 版本 + 锚点(P/S/M/I)”;正文与导出一致;路径表达显式 gamma(ell)、d ell 并记录 delta_form。

V. 评分权重与阈值(示例,可直接复用)

指标

方向

权重 w_i

合格阈值

记分映射说明

ΔT_arr

越小越好

0.35

`

ΔT_arr

r_phi

越大越好

0.25

r_phi ≥ 0.6

Fisher z 区间后映射

ε_flux

越小越好

0.15

≈0@O(θ^2)

近轴守恒区约束

p_dim

=1 要求

0.15

= 1.0

否则直接不通过

Q_res

越小越好

0.10

依标定带

稳健分位差

组合总分:Q = (0.35 q_ΔT + 0.25 q_r + 0.15 q_flux + 0.15 q_dim + 0.10 q_res)。


VI. 机读模板(可直接落库)

A. scorecard.json

{

"version": "1.0.0",

"dataset_id": "ptn-demo",

"baseline": { "id": "base-001", "version": "1.2.3" },

"method": { "id": "mA-010", "version": "2.0.0" },

"metrics": {

"DeltaT_arr_s": { "mean": -2.3e-9, "std": 4.8e-9, "U_k2": 1.5e-9 },

"r_phi": { "value": 0.72, "ci95": [0.61, 0.80] },

"epsilon_flux": { "median": 0.004, "p95": 0.011 },

"p_dim": 1.0,

"Q_res": 0.13

},

"score": { "Q": 0.78 },

"tests": {

"paired": { "DeltaT_arr": { "p_perm": 0.004, "B": 10000 } },

"FDR": 0.08

},

"see": [

"EFT.WP.Core.Equations v1.1:S20-1",

"EFT.WP.Core.Metrology v1.0:check_dim",

"Data.Benchmarks v1.0:PROTO"

],

"version_lock": true

}

B. results.md(节选大纲)

# PTN Results — v1.0.0

## 1. Summary

- One-liner conclusion; core metrics with uncertainty.

## 2. Core Metrics

- Delta T_arr (s): mean±U, hist, BA plot.

- r_phi: value + 95% CI; scatter vs. identity.

- epsilon_flux: distribution; paraxial guard lines.

## 3. Secondary Metrics

- ΔM, κ_coh …

## 4. Visual Gallery

- Figures exported (PDF/PNG), legends, units.

## 5. Repro & Audit

- Seeds, config, manifests; audit.jsonl hash.


C. bench_score.yaml(接口契约)

version: "1.0.0"

call: "I90-bench_score"

inputs:

results: "PTN_EXPORT/results.parquet"

baseline: "PTN_EXPORT/baseline.parquet"

metrics: ["DeltaT_arr_s","r_phi","epsilon_flux","p_dim","Q_res"]

weights: { DeltaT_arr_s: 0.35, r_phi: 0.25, epsilon_flux: 0.15, p_dim: 0.15, Q_res: 0.10 }

thresholds:

tau_T_s: "3*u(T_arr)"

r_phi_min: 0.6

flux_ok: "≈0@O(theta^2)"

p_dim: 1.0

mapping:

type: "sigmoid"

a: 1.0

b: 0.0

exports:

files: ["scorecard.json","results.md","figs/*.pdf","reports/check_dim_report.json"]


VII. 结果页最小必填(与第 5 章对齐)


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/