目录 / 文档-技术白皮书 / 19-EFT.WP.Methods.SynthData v1.0
一句话目标:在 G=(V,E) 执行图中稳定运行合成数据服务,以背压与资源编排保障 SLO,并保持到达时与隐私预算一致。
I. 范围与对象
- 输入
- stream(req_i):实时生成请求流,含 seed, condition, budget, TraceID
- engine:已冻结的生成引擎与 SynthSpec
- policy.runtime:背压、限流、批处理、热更新与 SLO 目标
- sync_ref:时基与到达时参考(含 offset/skew/J)
- 输出
- stream(resp_i):按 SLO 返回的样本或包
- runtime_report:TS.sli.*, rho, W_q, latency_ms_p99, drop_rate
- manifest.synth.runtime:运行时清单与签名
- 约束
队列稳定 rho < 1;eps_total ≤ eps_budget;delta_form ≤ tol_Tarr;可重放与幂等
II. 名词与变量
- 速率与稳定:lambda_in, mu_eff, rho = lambda_in / mu_eff, cap
- 排队与延迟:W_q, W, latency_ms_p99, drop_rate, retry_k
- 批与并行:B(batch size), K(并行 worker 数), T_serv(B)
- 资源:gpu_util, mem_free, oom_rate, disk_io, net_bw
- 时基与到达时:tau_mono, ts, offset/skew/J, T_arr, delta_form
- 隐私会计:eps_i, delta_i, eps_total = accountant( {eps_i, delta_i} )
- SLO/SLI:TS.sli.rho, TS.sli.latency_p99, TS.sli.drop_rate, TS.sli.oom_rate
III. 公设 P414-*
- P414-1(稳定优先):任何时刻需满足 rho < rho_max < 1,稳定性优先于吞吐。
- P414-2(幂等与可重放):以 TraceID、seed、engine/version 保证请求级可重放与幂等。
- P414-3(背压一体化):限流、动态批、队列裁剪与降级策略统一受控,不允许隐式丢弃。
- P414-4(到达时一致):流式样本写入 offset/skew/J 与 T_arr 两口径,发布前校核 delta_form。
- P414-5(隐私预算闭环):eps_total 由会计器连续追踪,越界即熔断。
- P414-6(热更新无撕裂):engine 热切换采用双轨与栅栏提交,禁止部分批跨版本。
- P414-7(度量即契约):所有 SLI 必须可落盘可签名,作为发布闸门输入。
IV. 最小方程 S414-*
- S414-1(有效服务率与并行批处理)
mu_eff = ( K * B ) / E[ T_serv(B) ]。若使用自适应批:B* = argmin_B E[latency(B)]。 - S414-2(稳态与延迟近似)
对 M/M/1 近似:W ≈ 1 / ( mu_eff - lambda_in );
W_p99 ≈ ( ln(100) ) / ( mu_eff - lambda_in );
对 M/M/k 可用 rho = lambda_in / ( k * mu_worker ) 与标准 Erlang-C 近似计算 W_q。 - S414-3(丢弃与重试预算)
drop_rate = drops / arrivals;retry_budget = min( retry_k, retry_k_max );
总延迟 latency = W_q + T_serv(B)。 - S414-4(隐私会计)
eps_total = accountant( { (eps_i, delta_i) } ),约束 eps_total ≤ eps_budget,delta_total ≤ delta_budget。 - S414-5(到达时两口径与差异)
T_arr = ( 1 / c_ref ) * ( ∫ n_eff d ell );T_arr = ( ∫ ( n_eff / c_ref ) d ell );
delta_form = | ( 1 / c_ref ) * ( ∫ n_eff d ell ) - ( ∫ ( n_eff / c_ref ) d ell ) |。 - S414-6(Little 定律核验)
L = lambda_in * W;以 L 核验队列监测的一致性。
V. 合成流程 M40-14(接入→编排→背压→审计)
- 就绪
冻结 engine/version、SynthSpec、policy.runtime;配置 cap, B∈[B_min,B_max], K。 - 接入与归一
校验 TraceID/seed/budget;缺省时基映射到 tau_mono;写入 offset/skew/J 初值。 - 动态批与并行
auto_batcher 在 latency 与吞吐目标间优化 B;K 受 gpu_util/mem_free 约束自调。 - 背压与限流
当 rho ≥ rho_hi 或 mem_free ≤ m_min:触发 rate_limit(r_out)、shed(policy)、degrade(profile)。 - 重试与幂等
对 5xx/timeout 以内幂等重试 ≤ retry_k;以 TraceID 去重;失败记录入审计流。 - 到达时固化
对涉时样本补记 T_arr 两口径与 delta_form;超差触发 timepath_hardening。 - 会计与熔断
累计 eps_total;超预算触发 circuit_open,仅允许低敏度降级或拒绝。 - 审计、清单与签名
生成 runtime_report 与 manifest.synth.runtime;hash_sha256 与 signature 落盘。
VI. 契约与断言 C40-14xx
- C40-1401(稳定):rho ≤ rho_max 且 E[rho] 滑窗均值连续 T 内不越界。
- C40-1402(延迟):latency_ms_p99 ≤ target_p99;W_q ≤ W_q_max。
- C40-1403(丢弃):drop_rate ≤ tol_drop;retry_success ≥ r_min。
- C40-1404(资源):gpu_util ∈ [u_min,u_max],oom_rate ≤ tol_oom,mem_free ≥ m_min。
- C40-1405(到达时):delta_form ≤ tol_Tarr,|offset| ≤ off_max,J ≤ J_max。
- C40-1406(隐私):eps_total ≤ eps_budget 且 delta_total ≤ delta_budget。
- C40-1407(热更新):跨版本批次为零;dual_commit=true。
- C40-1408(幂等):unique(TraceID);重复请求输出哈希一致。
VII. 实现绑定 I40-14*(接口原型与不变量)
- stream_synth(stream, engine, policy) -> stream'
- auto_batcher(metrics, target) -> B
- rate_limit(stream, r_out) -> stream'
- backpressure_controller(metrics, policy) -> actions({shed, degrade, expand, pause})
- resource_monitor() -> {gpu_util, mem_free, disk_io, net_bw}
- privacy_accountant(eps_delta_stream) -> {eps_total, delta_total}
- timepath_hardening(ds, sync_ref) -> ds'
- emit_runtime_manifest(metrics, contracts) -> manifest.synth.runtime
- 不变量:rho < 1;idempotent(TraceID, seed);delta_form ≤ tol_Tarr;eps_total ≤ eps_budget;engine/version 与批次一致。
VIII. 交叉引用
- 见《EFT.WP.Methods.Cleaning v1.0》 第11章(流式清洗与背压闭环)获取队列与限流协同口径。
- 见《EFT.WP.Methods.CrossStats v1.0》 第7章(漂移/对齐)与第14章(SLO 与审计)用于运行期阈值与审计映射。
- 见本卷第8章(时序与事件合成)与第13章(发布冻结)对到达时与清单签名的延续。
IX. 质量度量与风控
- SLI
TS.sli.rho, TS.sli.latency_p99, TS.sli.drop_rate, TS.sli.oom_rate, TS.sli.retry_success, TS.sli.delta_form, TS.sli.eps_total。 - 风控动作
- 稳定性:当 rho > rho_hi→降 r_out、增 B(受 latency 约束)、启用 K+(资源允许)。
- 延迟:latency_p99 越界→缩 B、优先级调度、启用近线缓存或草图级降级。
- 资源:mem_free < m_min 或 oom_rate 上升→收缩 K/B、分区负载、冷/热迁移。
- 隐私:eps_total 接近上限→切低敏度路径或拒绝新请求。
- 到达时:delta_form 越界→执行 timepath_hardening 并限流涉时模态。
小结
- 本章以 P414-* 固化“稳定优先、幂等重放、会计闭环”的运行准则,
- 以 S414-* 给出稳定性、延迟与预算的可计算基式,
- 以 M40-14 将接入、编排、背压、会计与审计串成闭环,
- 以 C40-14xx 作为 SLO 闸门与熔断触发条件,
- 以 I40-14* 落地接口与不变量,确保流式合成在资源受限与隐私预算内稳定运行并满足发布前的一致性要求。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/