目录 / 文档-技术白皮书 / 24-EFT.WP.Particle.TopologyAtlas v1.0
一句话目标:给出拓扑图谱相关任务的公开数据集、评测协议与基准指标,确保跨团队结果的可比性、可复现与可审计。
I. 范围与对象
- 覆盖的数据形态:二维/三维标量场x(r)、取值于 S^1/S^2 的相位/取向场θ(r), n(r),以及时空序列x(r,t)、世界线集合 Γ(t)。
- 评测对象:拓扑密度 q(x)、持久同调 D 与景观 λ_D、图谱 Atlas={U_a, φ_a, ψ_a, T_ab}、不变量 Inv = {Q, Lk, Tw, Wr, ...}、检索嵌入 Z、运行态指标与 manifest.topo.*。
- 输出:基准任务定义、评分公式、提交与复核流程、许可与合规字段。
- 边界:所有评测需在一致 RefCond、τ_policy 与单位体系下进行;若不满足,结果不计分。
II. 名词与变量
- 数据集与分层:DS.syn(解析/可控合成)、DS.sim(物理仿真)、DS.exp(实验/实采)、DS.stream(流式)。
- 分割与难度:split ∈ {train, val, test, test-hard, OOD};noise ∈ {low, med, high}。
- 评测核:d_B(D̂, D_ref), W_p(D̂, D_ref), Δ_cyc, sup|Σψ-1|, Recall@K, delta_form, delta_form_rt。
- 许可与追溯:license, provenance, seed, data_hash, RefCond。
III. 数据集目录与内容(建议清单)
- DS.syn.GL-2D:Ginzburg–Landau 相位场,含涡旋;Q = Σ winding 可解析给出;提供 θ(r), q(r) 与 Q_gt。
- DS.syn.O3-SkX:S^2 取向场的 skyrmion 文本集;Q ∈ Z,含半整数噪声干扰版。
- DS.syn.Hopf-3D:Hopf 纤维场;世界线链接 Lk_gt 可控;提供体素化取向场与参考 Γ_ref。
- DS.sim.FLUID-PIV:涡量场与相位解缠残差;检验 q(x) 与 D 的稳健性。
- DS.exp.MFM-SKX:磁力显微 skyrmion 图像对;配对的参考取向重建。
- DS.exp.HOLO-PHASE:干涉相位与包裹解;对清洗链与拓扑守恒性评测。
- DS.stream.RECONNECT:x(r,t) 中的重联事件;标注 E_reconn 与窗口化不变量变化。
- 附加 OOD:来自与训练域不一致的噪声/尺度/分辨率配置,用于泛化测试。
每个样本包含:
- data/ 原始与中间层数据;gt/ 解析或参考产物(Q_gt, Γ_ref, D_ref);
- meta.json:TraceID, license, provenance, RefCond, units/dim, seed, split, noise;
- README.md:生成/采集说明、坐标与掩膜。
IV. 公设 P90F-*
- P90F-1(可追溯):任一数据文件必须提供 data_hash、provenance 与 license。
- P90F-2(尺度一致):比较前须声明 RefCond 与 τ_policy,并完成尺度归一。
- P90F-3(两口径并行):若算法存在 formA/B 或 stream/offline,提交物中必须包含两者与 delta_form。
- P90F-4(无泄露):test 与 test-hard/OOD 禁止使用监督信号或元数据进行任何拟合;评测脚本将核验泄露线索。
- P90F-5(单位/量纲显式):unit(field) 与 dim(field) 必填,check_dim 通过。
V. 最小方程 S90F-*(评分与聚合)
- S90F-1(不变量误差):err_Inv = Σ_{i∈Inv} w_i * | Inv̂_i - Inv_{i,gt} | / scale_i。
- S90F-2(持久同调误差):err_PD = α * d_B(D̂, D_ref) + (1-α) * W_p(D̂, D_ref),α ∈ [0,1]。
- S90F-3(图谱质量):score_atlas = exp( - ( Δ_cyc / tol_cyc + sup|Σψ-1| / tol_ψ + κ / κ_max ) ),其中 κ = cond_max(∂φ)。
- S90F-4(检索指标):score_retr = 0.5*( Recall@K / R_min ) + 0.5*( 1 - mean(d_exact)/tol_rank )。
- S90F-5(流式一致性):penalty_stream = β1 * p95(delta_form_rt)/tol_rt + β2 * lag_ms_p95 / (2*τ_window)。
- S90F-6(总分):
Score = GM( clip(1 - norm(err_Inv)), clip(1 - norm(err_PD)), score_atlas, score_retr, clip(1 - penalty_stream) ),
其中 GM 为几何平均,clip(z) = min( max(z, 0), 1 ),norm(·) 以基线统计归一。
unit(Score) = "[1]";各任务子分与总分需分别上报。
VI. 评测流程 M90-F1(提交→复核→发布)
- 准备与自测
- 拉取 eval-kit 与 RefCond;在 val 上生成 manifest.topo.case/atlas/runtime。
- 校验两口径与 check_dim、contracts 通过(见附录B)。
- 生成提交包
- 逐样本产出 manifest.* 与工件 artifacts,写入 submission.jsonl(每行一条结果 URI 或 hash://)。
- 附上 code.ver/git/seed/runtime 与 deps。
- 线上评测
- 评测端重算 D_ref/Inv_ref 或加载参考,执行 S90F-*;
- 复核 license/provenance 与 P90F-*;泄露则整包作废。
- 发布与存档
- 生成 report.json,写入 contracts 与分项分数;
- 写入排行榜与面板映射键。
VII. 契约与阈值(C90F-*)
- C90F-01(完整性):提交包须包含 manifest.*、submission.jsonl、signature;缺失即 fail。
- C90F-02(不变量门):err_Inv ≤ tol_Inv 且整数不变量满足取整门(见附录E C90-166)。
- C90F-03(PD 稳定性门):d_B ≤ tol_B 且 W_p ≤ tol_Wp。
- C90F-04(图谱门):Δ_cyc ≤ tol_cyc,sup|Σψ-1| ≤ 1e-6。
- C90F-05(检索门):Recall@K ≥ R_min 且 mean(d_exact) ≤ tol_rank。
- C90F-06(流式门):p95(delta_form_rt) ≤ tol_rt 且 lag_ms_p95 ≤ 2*τ_window。
- C90F-07(许可门):license ∈ {Apache-2.0, MIT, CC-BY-4.0, CC-BY-SA-4.0} 或明确商业许可;否则不计分。
- C90F-08(可复现):随机 seed、deps、code.ver 缺失或回放失败则降级或拒绝。
VIII. 实现绑定 I90-*(数据与评测)
- I90-201 load_dataset(uri, split, filters) -> iterator(samples)
- I90-202 render_refcond(meta) -> RefCond
- I90-203 compute_reference_products(sample, policy) -> {Q_gt, Γ_ref, D_ref}
- I90-204 evaluate_submission(submission, refs, rules) -> report
- I90-205 aggregate_scores(per_sample, scheme="GM") -> leaderboard_entry
- I90-206 check_leakage(train_meta, test_meta) -> {pass, evidence}
- I90-207 emit_benchmark_manifest(results) -> manifest.bench
不变量:non_decreasing(τ);Σ_a ψ_a ≡ 1;check_dim(all);并行两口径与 delta_form 落盘。
IX. 交叉引用
- 数学与拓扑基线见第2章;拓扑对象与事件标注口径见第3/5/6章。
- 复形构建与滤过策略见第7章;持久同调稳定性与景观范数见第8章。
- 图谱与坐标过渡质量度量见第9/10/11章。
- 噪声与清洗规范见第12章;图谱对比与检索评测见第13章。
- 运行时字段与面板映射见第14章。
- 接口、契约、清单与不确定度发布见附录A/B/C/E;指标与漂移警戒阈值见附录D。
X. 质量与风控
- SLO 建议:d_B_p95 ≤ 0.02*scale_τ;Δ_cyc ≤ 1e-3;Recall@10 ≥ 0.9;coverage ≥ 0.95。
- 审计要点:核对 license/provenance/data_hash;随机抽检回放一致性;交叉运行于两种独立环境比对 delta_form。
- 回退策略:fail-fast → 最小子集复核 → 重新评分 → 公示差异;全程记录证据哈希并签名。
小结
- 本附录定义了拓扑图谱的数据集族、评测协议与聚合评分,并以 P90F/S90F/M90-F1/C90F/I90 形成从数据—算法—清单—排行榜的一体化闭环。
- 通过 RefCond、两口径与单位/量纲的强制规范,确保不同实现间结果可比、可复现、可审计。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/