目录 / 文档-技术白皮书 / 24-EFT.WP.Particle.TopologyAtlas v1.0
一句话目标:定义拓扑图谱相似性度量与检索管线,建立“精确度量↔近似嵌入”两口径并行与偏差闭环,支撑跨数据源、跨图册的快速对比与可审计检索。
I. 范围与对象
- 输入
- 图谱与要素:Atlas = { (U_a, phi_a, K_a(τ), D_a, Γ_a, G_{event,a}), T_ab, ψ_a }(见第9–11章)。
- 查询与库:Q(查询图谱/子域/不变量集)、DB = {Atlas_i}。
- 度量策略:metric.policy = {on={D, λ, β_seq, Inv, Γ, G_event}, align={τ, trans}, norm, kernel, approx}。
- 输出
- 相似度与排名:score( Q, Atlas_i ),前 K 检索集 TopK。
- 两口径差:delta_form_retr = | d_exact - d_approx | 或景观/核空间范数差。
- 清单:manifest.topo.search(度量口径、索引摘要、证据、签名)。
- 边界与约束
- non_decreasing(τ)、Σ_a ψ_a ≡ 1 需保持;跨图比较需声明 align 与归一化 norm。
- 所有度量与相似度的 unit(·) 与 dim(·) 必显式。
II. 名词与变量
- 持久图与景观:D = {(b_i, d_i)},λ_D(t,k)(第 k 大 t-切片高度)。
- 典型距离:d_B(bottleneck)、W_p(p-Wasserstein),||λ_D - λ_E||_p。
- 核函数:k_PSS(persistence scale-space),k_SW(sliced Wasserstein)。
- 图谱级距离:d_Atlas(见第11章 S911-5),这里扩展为跨图册对齐后的距离 d_Atlas^align。
- 轨迹/曲线距离:d_F(Fréchet),d_DTW(动态时间规整);事件图距离 d_GED(graph edit)。
- 嵌入与索引:Φ(·) → R^m(景观/图核/图谱签名),Z = Φ(Atlas),Index ∈ {HNSW, PQ, IVFPQ}。
- 两口径:form=exact(精确度量)与 form=approx(嵌入/索引近似)。
III. 公设 P913-*
- P913-1(对齐先行):任意跨图册度量前,需给出 align={τ, T_ab, norm};未对齐的距离只可作粗筛。
- P913-2(两口径并行):对每个候选返回 d_exact 与 d_approx,记录 delta_form_retr 并用于阈值门。
- P913-3(分解与汇总):局部距离按单位分解权重 ψ_a 汇总;重叠区重复计数须校正。
- P913-4(量纲合规):unit(d_B)=unit(τ),unit(W_p)=unit(τ),unit(d_F)=unit(x);核相似度无量纲。
- P913-5(可审计):查询副本、索引版本、随机种子与候选证据(匹配对、最短路、配对条目)落盘。
- P913-6(稳定窗口):在第8章建议的稳定窗口内比较,避免尺度外伪差异。
IV. 最小方程 S913-*
- 持久图距离与核
- S913-1(bottleneck):d_B(D,E) = inf_γ sup_{p∈D} || p - γ(p) ||_∞,γ 为到对角线扩展的双射。
- S913-2(Wasserstein):W_p(D,E) = ( inf_γ Σ_{p∈D} || p - γ(p) ||_∞^p )^{1/p}。
- S913-3(景观 L_p):||λ_D - λ_E||_p = ( ∬ | λ_D(t,k) - λ_E(t,k) |^p dt dk )^{1/p}。
- S913-4(PSS 核):k_PSS(D,E;σ) = ( Σ_{p∈D} Σ_{q∈E} exp( - ||p - q||_2^2 / (8σ^2) ) ) / (4πσ^2)。
- S913-5(SW 核)》:对角度 θ切片投影并积分相应一维W_1,k_SW = exp( - SW^2 / (2σ^2) )`。
- 图谱级汇总与对齐
- S913-6(局部→全局)》:d_{topo}(Q, A) = ( Σ_a w_a * d_loc(D_Q^a, D_A^{π(a)}) ), 其中 w_a = ( ∫{U_a} ψ_a dV ) / ( Σ_b ∫{U_b} ψ_b dV ),π(a)` 为过渡映射与最近邻匹配。
- S913-7(τ 对齐)》:τ_Q = s τ_A + b,(s,b) = argmin Σ_a d_loc( D_Q^a(τ_Q), D_A^a(τ_A) ),约束 s>0`。
- S913-8(d_Atlas^align)》:d_Atlas^align = max( d_{topo}, sup_x |Σ_a ψ_a - 1| )`(继承第11章一致性项)。
- 轨迹与事件
- S913-9(Fréchet)》:d_F(Γ_1, Γ_2) = inf_α,β sup_t || Γ_1(α(t)) - Γ_2(β(t)) ||_2`。
- S913-10(事件图)》:d_GED(G_1,G_2) = min_{edit seq} cost(seq)`,节点以事件拓扑标签/时间窗加权。
- 多通道融合与评分
- S913-11(融合)》:score = σ( - Σ_c λ_c * d_c + Σ_k μ_k * k_k ),σ为单调映射(如softplus/sigmoid`)。
- S913-12(两口径差)》:delta_form_retr = | d_exact - d_approx |或|| Φ_exact - Φ_approx ||_2`。
- 单位与量纲
S913-13:check_dim(d_B)=unit(τ),check_dim(W_p)=unit(τ),check_dim(d_F)=unit(x),check_dim(k_*)="[1]"。
V. 计量流程 M90-13
- 就绪:解析 Q 与 DB,锁定 metric.policy、align 与 RefCond = {τ_window, σ, p, weights}。
- 对齐:估计 s,b 执行 τ 重标定;构建跨图册局部匹配 π(a) 与权重 w_a。
- 精确距离:计算 d_exact(组合 d_B/W_p/景观/轨迹/事件),输出多通道分解。
- 嵌入与索引:计算 Z_Q = Φ(Q)、Z_i = Φ(Atlas_i);在 Index 上检索候选 Cand。
- 重排与两口径比对:对 Cand 计算 d_exact 与 d_approx 并重排,记录 delta_form_retr。
- 质量门与回溯:若门未过(见 VI),调整 align/weights/σ/p 或扩展 τ_window 后重算。
- 落盘:
manifest.topo.search = {Q.hash, Index.ver, Φ.ver, policy, align, TopK, d_breakdown, delta_form_retr_stats, RefCond, evidence, signature}。
VI. 契约与断言 C90-131x(建议阈值)
- C90-13101(对齐门)》:|s-1| ≤ tol_s且|b| ≤ tol_b;建议 tol_s ≤ 0.1、tol_b ≤ 0.05*range(τ)`。
- C90-13102(两口径门)》:delta_form_retr_p95 ≤ tol_retr;建议 tol_retr = 0.03 * scale_τ`。
- C90-13103(一致性门)》:sup_x |Σ_a ψ_a - 1| ≤ 1e-6,并且 Δ_cyc` 不劣化(见第9章)。
- `C90-13104(证据门)》:TopK 每条结果至少包含三类证据(配对条、匹配图、轨迹比对或核相似度)。
- C90-13105(性能门)》:近似检索召回 R@K ≥ R_min(建议 R_min=0.95),且 P95` 延迟在预算内。
- C90-13106(量纲门)》:check_dim(all d/k)全通过;跨域比较前必须声明norm`。
VII. 实现绑定 I90-13*
- I90-131 build_persistence_distance(D1, D2, policy) -> {d_B, W_p, landscape_p}
- I90-132 atlas_align_tau(Q, A) -> {s, b}
- I90-133 atlas_local_match(Q, A, T_ab, ψ) -> {π, w}
- I90-134 atlas_distance(Q, A, π, w, policy) -> d_exact, breakdown
- I90-135 embed_atlas(Atlas, Φ_policy) -> Z(景观/核特征/图核拼接)
- I90-136 build_index({Z_i}, index_policy) -> Index
- I90-137 query_index(Index, Z_Q, K) -> Cand
- I90-138 rerank_with_exact(Q, Cand, policy) -> TopK, delta_form_retr_stats
- I90-139 compare_tracks_events(Q, A) -> {d_F, d_DTW, d_GED}
- I90-13A assert_search_contracts(results, rules) -> report
- I90-13B emit_search_manifest(results, policy) -> manifest.topo.search
不变量:non_decreasing(τ);Σ ψ ≡ 1;delta_form_retr ≤ tol_retr;check_dim 全通过;索引/嵌入版本落盘可追溯。
VIII. 交叉引用
- 复形/滤过与稳定窗口:见第7–8章。
- 图谱构建与过渡:见第9章(T_ab, ψ_a, Δ_cyc)。
- 不变量与计量:见第10章(Inv 作为检索通道之一)。
- 增量维护:见第11章(索引增量更新与 patch 触发)。
- 清洗稳健:见第12章(对噪声的度量稳定性与 τ 重标定)。
- 误差传播:见附录E(度量与嵌入的不确定度合成)。
IX. 质量与风控
- SLO:R@K ≥ R_min,delta_form_retr_p95 ≤ tol_retr,TopK 证据完备率 ≥ 99%。
- 回退路径:近似检索 → 扩大候选集 → 仅局部度量 → H0/β_seq 快速筛 → 人工审阅,逐级放宽并放大 U。
- 审计:保留候选配对、匹配代价矩阵、核相似度热图、轨迹比对曲线、索引动态与随机种子;对外发布摘要脱敏并签名。
小结
- 本章给出图谱对比与检索的工程闭环:P913/S913/M90-13/C90-131x/I90-13*。
- 通过跨图对齐、精确度量与近似嵌入两口径并行、证据化重排与契约门,保障检索结果可解释、可复现、可审计;发布以 manifest.topo.search.* 统一落盘。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/