目录 / 文档-技术白皮书 / 24-EFT.WP.Particle.TopologyAtlas v1.0
一句话目标:把观测数据(点云/场/图)稳定映射为可计算复形 K(τ) 与滤过 F = {K(τ)},输出条形码/持久图,为缺陷识别、世界线与事件分析提供统一的拓扑骨架。
I. 范围与对象
- 输入
- 点云与度量:X = {x_i ∈ R^d}, 度量 d(·,·) 或加权度量 d_w;密度/标量场 f(x);可选权重 w(x)、置信 q(x)。
- 网格/体素数据:规则/非规则网格上的标量 f: cells → R;掩膜与边界 ∂M。
- 控制参数与策略:滤过参数网格 τ_grid,正则尺度 ℓ_reg,域系数域 F(如 Z_2, Z_p),最大维数 k_max。
- 输出
- 复形与滤过:K(τ)(τ 单/多参数),生成元与 grade(σ);边界算子 ∂_k。
- 持久同调:D = { (b_i, d_i, k) },条形码与诊断(稳定性、口径差)。
- 清单:manifest.topo.complex(构建口径、阈值、哈希、SLO 与签名)。
- 边界与约束
- 滤过单调:τ1 ≤ τ2 ⇒ K(τ1) ⊆ K(τ2)。
- 维数预算:k ≤ k_max;算子与内存受限需可回退。
- 载体定向一致,顶点全序可复现(哈希/排序规则固定)。
II. 名词与变量
- 复形类型:VR_ε(Vietoris–Rips),Cech_r(Čech),Alpha_α(α/功率复形),Cubical_λ(亚水平集),Witness_ε(L|X)。
- 滤过:F = { K(τ) | τ ∈ T, τ ↑ };多参数 τ = (τ_1, …, τ_m) 以偏序。
- 链与边界:C_k(K;F),∂_k: C_k→C_{k-1};出生/死亡 b_i/d_i。
- 稳定性度量:瓶颈距离 d_B,Wasserstein 距离 d_W,p。
- 两口径差:delta_form_PH(边界矩阵 vs. 上同调/离散 Morse 口径)。
- 量纲:unit(ε)=unit(r)=unit(α)="[L]",dim(D) = "[1]"。
III. 公设 P907-*
- P907-1(度量一致) 所用 d 为度量或准度量,声明其来源(欧氏/测地/各向异性);加权情形需给出 d_w 定义与单位。
- P907-2(采样与尺度) 导数/密度计算的正则尺度 ℓ_reg 与滤过步长 Δτ 必显式;ℓ_reg ≥ 2.5 * grid_spacing(沿用第4章)。
- P907-3(单调滤过) 构建算法必须保证 K(τ) 单调嵌套;任何违反单调的边/胞将被拒收并记录。
- P907-4(顶点全序) 以确定性全序 ord(v) 与哈希 hash(v) 生成所有高维胞,确保复现性。
- P907-5(两口径并行) 持久同调需并行计算:边界矩阵约化(form=bdry)与上同调/离散 Morse(form=coho/morse),落盘 delta_form_PH。
- P907-6(边界策略) ∂M ≠ ∅ 时采用相对同调或填充策略,策略需落盘并在条形码中标注。
- P907-7(稳定性) 仅在 f 可驯或 X 有界/有限时发布 D;跨口径/采样的 d_B 必报告。
IV. 最小方程 S907-*
- Rips/Čech/α/功率复形
- S907-1 (VR):σ = [v_0,…,v_k] ∈ VR_ε ⇔ max_{i,j} d(v_i,v_j) ≤ ε。
- S907-2 (Čech):σ ∈ Cech_r ⇔ ( ∩_{i} B(v_i,r) ) ≠ ∅,其中 unit(r) = "[L]"。
- S907-3 (α/功率):令 r_i(τ) = sqrt( τ + w_i ),σ ∈ Alpha_τ ⇔ ∩_{i} B(v_i,r_i(τ)) 非空且其 Delaunay 条件满足。
- S907-4 (Witness):σ ⊂ L 被 ε-见证:∀ witness x ∈ X, max_{v∈σ} d(x,v) - min_{u∈L} d(x,u) ≤ ε。
- Cubical 复形与亚水平滤过
- S907-5 (Sublevel):K(λ) = { cell c | f(c) ≤ λ };λ 单调上升给出滤过。
- S907-6 (测度显式):( ∫_{cells(λ)} 1 dN ) 表示细胞计数,dN 为计数测度。
- 持久同调定义
- S907-7:包含映射 i_{τ1→τ2}: H_k(K(τ1)) → H_k(K(τ2));出生/死亡由像核确定。
- S907-8:持久对 p = (b,d) 的稳定性:d_B(D_f, D_g) ≤ || f - g ||_∞(对驯函数)。
- 两口径一致性差
S907-9:delta_form_PH = dist_intervals( D_bdry , D_coho )(可用匹配后 L_∞ 误差或多重集对称差)。 - Rips–Čech 互嵌(常用一致性门)
S907-10:Cech_r ⊆ VR_{2r} ⊆ Cech_{2r}(用于阈值一致性断言)。 - 单位与量纲校核
S907-11:check_dim(ε) = check_dim(r) = check_dim(α) = "[L]";check_dim(D) = "[1]";check_dim(∂_k)= "[1]"。
V. 计量流程 M90-7
- 就绪
- 选择复形类型 type ∈ {VR, Cech, Alpha, Cubical, Witness} 与系数域 F;设 k_max、τ_grid、ℓ_reg、Δτ。
- 清洗与对齐(见配套《EFT.WP.Methods.Cleaning v1.0》):去重/去异常、度量选择与标准化。
- 载体与邻接构建
- 点云:构建 kNN/ε 邻接与(可选)Delaunay;网格:生成细胞与 f 的单调延拓。
- 记录顶点全序与哈希;对权重 w(x) 归一与单位声明。
- 复形生成
- 按 S907-1…S907-6 构建 K(τ0) 并增广到 τ_grid;对 Witness 使用地标 L ⊂ X 与最邻近索引。
- 对 α/功率复形,验证 Delaunay 条件与球面半径的单位一致。
- 滤过与打分
- 为每个胞元赋 grade(σ)(首次出现的 τ);保证 grade 单调。
- 输出 F = {K(τ)} 与 ∂_k(τ) 稀疏结构。
- 持久同调计算(两口径并行)
- form=bdry:边界矩阵列约化;
- form=coho/morse:上同调或离散 Morse 压缩;
- 比较生成 delta_form_PH、d_B、d_W,p。
- 稳定性与一致性校核
- 变动性评估:对重采样/扰动的 X' 或 f',估计 d_B(D, D');
- Rips–Čech 门:抽查 S907-10 的互嵌一致性。
- 落盘与签名
产出 manifest.topo.complex = {type, metric, F, k_max, τ_grid, grade.hash, D, d_B, delta_form_PH, params, algo.ver, seed, boundary.policy}。
VI. 契约与断言 C90-71x(建议阈值)
- C90-7101 单调性:任意 σ 若 σ ∈ K(τ2) 且 τ1 ≤ τ2,则 σ ∈ K(τ1);否则阻断。
- C90-7102 顶点复现:hash(v) 与 ord(v) 在同一数据上重复运行一致(哈希冲突率≈0)。
- C90-7103 两口径一致:delta_form_PH_p95 ≤ tol_PH(建议 tol_PH = 1e-3 对 Z_2)。
- C90-7104 稳定性门:对轻微扰动 ||δX||_∞ ≤ η 或 ||δf||_∞ ≤ η,d_B(D, D') ≤ η + tol_stab。
- C90-7105 Rips–Čech 一致:随机抽样子图满足 Cech_r ⊆ VR_{2r} 检验通过率 ≥ 99%。
- C90-7106 边界合规:采用相对同调时,条形码中标注 relative=true 且边界掩膜落盘。
- C90-7107 资源门:峰值内存与耗时不越过配额;越界则触发回退并放大 U。
- C90-7108 单位/量纲:check_dim(ε,r,α)="[L]";check_dim(D)="[1]" 全部通过。
VII. 实现绑定 I90-7*
- I90-71 build_knn_graph(X, k, metric) -> G
- I90-72 build_vr_filtration(G_or_X, ε_grid) -> {K(τ), grade}
- I90-73 build_cech_filtration(X, r_grid) -> {K(τ), grade}
- I90-74 build_alpha_power_complex(X, w?, τ_grid) -> {K(τ), grade}
- I90-75 build_cubical_filtration(f, grid, λ_grid, boundary_policy) -> {K(λ), grade}
- I90-76 persistent_homology_boundary(K(τ), F, k_max) -> D_bdry, diag
- I90-77 persistent_homology_cohomology(K(τ), F, k_max) -> D_coho, diag
- I90-78 compare_persistence(D_bdry, D_coho) -> {delta_form_PH, d_B, d_Wp}
- I90-79 assert_complex_contracts(ds, rules) -> report
- I90-7A emit_complex_manifest(results, policy) -> manifest.topo.complex
不变量:non_decreasing(τ);K(τ1) ⊆ K(τ2);顶点全序与定向一致;delta_form_PH ≤ tol_PH;check_dim 全通过。
VIII. 交叉引用
- 缺陷与密度源层:见第3–4章(q_* 与 j_topo 可驱动 f 的亚水平滤过)。
- 世界线与事件:见第5–6章(在 K(τ) 上追踪连通与环类的出生/死亡事件)。
- 图谱拼接与过渡:见第9章(子域复形对齐与过渡)。
- 不确定度传播:见第10章与附录E(grade 抖动、边界策略与两口径误差传播)。
- 运行时与面板:见第14章;清单键位:见附录C。
IX. 质量与风控
- SLO:delta_form_PH_p95 ≤ tol_PH;构建/持久计算成功率 ≥ 99%;d_B 在重采样下的 p95 ≤ 设定门限。
- 回退路径:full complex → sparsified (landmarks) → VR on kNN → H0-only (MST);逐级降低维数与复杂度并放大 U。
- 审计:落盘 ord/hash、grade 直方、资源曲线、随机种子;抽样重跑并记录 d_B 分布。
小结
- 本章提供 数据 → 复形 → 滤过 → 持久同调 的工程化链路:P907/S907/M90-7/C90-71x/I90-7*。
- 通过单调滤过、两口径并行与稳定性校核,确保条形码/持久图可复现、可审计,并与缺陷/事件/图谱拼接流程无缝对接。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/