目录 / 文档-技术白皮书 / 24-EFT.WP.Particle.TopologyAtlas v1.0
一句话目标:在 G=(V,E) 执行图上实现拓扑图谱的流式构建与服务化,包括窗口化、状态缓存、回退与运行面板,使增量 Atlas 发布具备低延迟、可复现与可审计。
I. 范围与对象
- 输入
- 流数据:场/取向样本 f(x,t), n(x,t)、轨迹 Γ(t)、事件流 events(t);批量补录与回放 replay。
- 运行策略:窗口 W、延迟容忍 L、水位线 ω(t)、缓存 TTL/size/policy、降级与回退策略。
- 既有产物:K(τ), D(第7–8章),Atlas 与 T_ab, ψ_a(第9–11章),索引与检索策略(第13章)。
- 输出
- 流式增量:K_t(τ), D_t, Atlas_t、patch_t 与合并结果 Atlas_t*。
- 面板指标与告警:panel.topo.runtime.*;清单 manifest.topo.runtime。
- 约束与边界
- 主时钟为事件时 t_event,处理时 t_proc 仅作运行度量;non_decreasing(τ)、Σ_a ψ_a ≡ 1 保持。
- 两口径并行:streaming 与 offline-recompute 必比对并记录差异。
II. 名词与变量
- 窗口与水位线:W ∈ {tumbling, hopping, sliding, session},窗口宽度 τ_w,步长 Δt_slide,水位线 ω(t),延迟容忍 L。
- 迟到与乱序:事件迟到量 ℓ = t_watermark - t_event,准入阈 ℓ ≤ L。
- 状态与缓存:S_cache(窗口/图/索引状态),命中率 H_cache,过期判据 stale(S)= (ts_now - ts(S) > TTL)。
- 两口径差:delta_form_rt = d_B( D_stream , D_offline ) 或 ||λ_stream - λ_offline||_p。
- 资源与背压:入流率 r_in,处理率 r_proc,队列长度 q,丢弃率 drop,限流门 r_max。
- 面板字段:lag_evt = t_now - t_event_max_seen,lag_wm = t_now - ω(t),fresh = ts_now - ts(last_emit)。
III. 公设 P914-*
- P914-1(事件时基优先):窗口、合并与清洗均以 t_event 与 ω(t) 为准;所有 ts 字段必须标注时基。
- P914-2(确定性可复放)》:给定 TraceID/seed/RefCond,回放产出逐位相同;随机源固定 seed`。
- P914-3(窗口闭合)》:窗口 W_k仅在ω(t) ≥ end(W_k) + L` 时允许封窗并发布。
- P914-4(状态最小化)》:S_cache` 仅保存重建所需最小充分统计;其余由可重算函数恢复。
- P914-5(两口径并行)》:流式与离线批重算并行,delta_form_rt` 必落盘;超阈须触发局部重建。
- P914-6(Atlas 一致)》:增量更新不得破坏 Σ_a ψ_a ≡ 1与Δ_cyc` 界限(见第9章)。
- P914-7(背压与回退)》:r_in > r_proc且q > q_max` 时,按策略降级(见 IX)并保留证据。
IV. 最小方程 S914-*
- 水位线与迟到准入
- S914-1:ω(t) = max_{events ≤ t} t_event - L。
- S914-2:事件 e 归属窗口当且仅当 t_event(e) ∈ W_k 且 t_proc(e) ≤ close(W_k) + L_proc。
- 窗口化复形与持久化
- S914-3:K_t(τ) = build_complex( data[W_k] , τ_policy ),non_decreasing(τ)。
- S914-4:D_t = persistence( K_t(τ) );unit(D)=unit(τ),check_dim 通过。
- 缓存与状态转移
- S914-5:命中率 H_cache = hits / (hits + misses);淘汰策略 policy ∈ {LRU, LFU, TTL, size}。
- S914-6:状态演化 S_{k+1} = F(S_k, data[ΔW]),其中 F 仅依赖增量 ΔW 与局部邻域。
- 两口径差与触发
- S914-7:delta_form_rt = d_B( D_stream , D_offline ) 或 ||λ_stream - λ_offline||_p。
- S914-8(重建门)》:若 delta_form_rt > tol_rt ∨ sup_x |Σ_a ψ_a - 1| > tol_pu,执行 recompute_subset(scope)`。
- 背压与限流
S914-9:稳定条件 r_proc ≥ r_in;背压比 β = r_in / r_proc。当 β > β_max,进入降级模式 mode ∈ {thin, coarsen_τ, postpone, drop_late}。 - 面板聚合
S914-10:panel.lag = {lag_evt, lag_wm};panel.delta = {delta_form_rt_p50/p95};panel.cover = κ_overlap;
panel.cache = {H_cache, size(S_cache)};panel.q = {r_in, r_proc, q, drop}。
V. 计量流程 M90-14
- 就绪:装载 policy = {W, τ_w, Δt_slide, L, TTL, tol_rt, β_max},初始化 S_cache、Index 与面板。
- 摄取与时间标注:对每条事件打 t_event/t_proc,纠正漂移(见配套白皮书《能量丝》时间基线)。
- 窗口分配与封窗:按 W 将事件分桶;当 ω(t) 超过阈值执行封窗。
- 增量构建:在 scope(W_k) 内更新 K_t(τ) → D_t → Atlas_t,修复 T_ab 与 ψ,校核 Δ_cyc。
- 两口径并行:对封窗窗口异步发起 offline-recompute(W_k),计算 delta_form_rt。
- 缓存与索引维护:更新 S_cache 与检索 Index(第13章),淘汰或压缩状态。
- 面板与告警:刷新 panel.topo.runtime.*,若超门触发重建/降级/告警。
- 落盘与发布:输出 manifest.topo.runtime = {TraceID, W_k, policy, S_cache.sig, delta_form_rt, panel, evidence, ts} 并签名。
VI. 契约与断言 C90-141x(建议阈值)
- C90-14101(水位线门)》:lag_wm_p95 ≤ tol_wm(建议 tol_wm = 2 * τ_w`)。
- C90-14102(迟到门)》:P(ℓ > L) ≤ 1e-3;超出进入 drop_late或postpone` 并计数。
- C90-14103(两口径门)》:delta_form_rt_p95 ≤ tol_rt(建议 0.03 * scale_τ`)。
- C90-14104(Atlas 一致)》:sup_x |Σ_a ψ_a - 1| ≤ 1e-6;Δ_cyc_p95 ≤ tol_cyc`(承接第9章)。
- C90-14105(缓存门)》:H_cache ≥ H_min(建议 0.8),stale(S)=false`。
- C90-14106(性能门)》:P95(latency_emit) ≤ budget;β ≤ β_max(建议 β_max=0.9`)。
- C90-14107(回放一致)》:回放与实时结果 d_B差异 ≤tol_replay`。
VII. 实现绑定 I90-14*
- I90-141 assign_windows(events, policy) -> {W_k}
- I90-142 advance_watermark(state, L) -> ω(t)
- I90-143 build_stream_complex(data[W_k], τ_policy, S_cache) -> {K_t(τ), D_t, state'}
- I90-144 update_atlas_incremental(Atlas, {K_t, D_t}, scope) -> Atlas_t, patch_t
- I90-145 reconcile_transitions(U_a∩U_b, D_a, D_b) -> {T_ab, Δ_cyc}
- I90-146 recompute_subset(Atlas, scope) -> Atlas_offline_subset
- I90-147 compare_stream_offline(D_stream, D_offline, metric) -> delta_form_rt
- I90-148 manage_cache(S_cache, policy) -> {state', H_cache}
- I90-149 update_runtime_panel(stats) -> panel.topo.runtime
- I90-14A rate_limit_and_backpressure(stats, policy) -> mode
- I90-14B emit_runtime_manifest(results, policy) -> manifest.topo.runtime
不变量:non_decreasing(τ);Σ ψ ≡ 1;Δ_cyc ≤ tol_cyc;delta_form_rt ≤ tol_rt;check_dim 全通过;可回放可追溯。
VIII. 交叉引用
- 复形/滤过与稳定性:见第7–8章。
- 图谱与过渡:见第9–11章(T_ab, ψ_a, Δ_cyc)。
- 清洗稳健:见第12章(流式清洗与 RefCond 协同)。
- 检索服务:见第13章(索引增量维护与重排)。
- 误差传播:见附录E(流式与离线误差合成)。
IX. 质量与风控
- SLO/SLI:latency_emit P95、delta_form_rt P95、H_cache、lag_wm、R@K(若在线检索)、drop_late。
- 降级路径:thin(采样) → coarsen_τ(增大 τ_w) → postpone(延后封窗) → drop_late(丢迟到),每步写入 fallback.stage 与影响范围。
- 审计与回放:对每个 W_k 保留输入哈希、状态签名、随机种子、面板快照与告警轨迹;回放需逐位复现。
小结
- 本章给出运行时与流式的工程闭环:P914/S914/M90-14/C90-141x/I90-14*。
- 以事件时基、水位线与最小状态为核心,结合两口径对比与严格契约门,保证拓扑图谱的低延迟发布、可复现与可审计;结果以 manifest.topo.runtime.* 统一落盘并在面板实时呈现。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/