目录文档-技术白皮书13-EFT.WP.Methods.SimStack v1.0

第7章 并行化、调度与资源


I. 范围与目标


II. 术语与符号

  1. 图与路径
    • G=(V,E),w(v)(标称工作量),c(e)(边通信代价),crit(G)(关键路径),D(G)=crit(G),W(G)=Σ_v w(v)。
    • dist_in(v):源到 v 的最短路径长度;dist_out(v):v 到汇的最短路径长度;slack(v) = D(G) - dist_in(v) - dist_out(v)。
  2. 就绪与优先级
    R(t):时刻 t 的就绪集;p(v):调度优先级分数;batch(v):可批量合并的最小单元。
  3. 资源与配额
    • 资源向量 cap = (cpu, mem, gpu, nic);需求 req(v) 同构于 cap。
    • 配额 quota(k):租户或阶段 k 的上限;主导资源占比 dom_ratio(k)。
  4. 速率与利用
    • lambda(v)、mu(v)、rho(v)=lambda(v)/mu(v);窗口估计 rho_hat(v;W)。
    • 成本度量 cost(res):按资源单价线性或分段线性组合。
  5. 指标与告警
    TS.latency.*,TS.throughput.*,TS.util.*,TS.queue.*,TS.hb.violations,TS.sli.success_rate。

III. 公设与最小方程(P61-/S62-

  1. P61-13(预算合规)
    任一时刻的分配 alloc(t) 必须满足 Σ_v use(v,t) ≤ cap 且对每个租户 use_k(t) ≤ quota(k)。
  2. P61-14(公平与无饥饿)
    对活跃租户 k,当 req_k 可被满足时,存在有界等待上界;采用主导资源公平分配(DRF)或其等价近似。
  3. P61-15(因果与幂等守护)
    调度、批量与推迟不得破坏 hb;若改变重试路径,必须遵循幂等或补偿契约。
  4. S62-40(makespan 下界与并行度)
    T_make(G,P) ≥ max( W(G)/P , D(G) ),P 为有效并行度。
  5. S62-41(Amdahl 与 Gustafson 上下界)
    S_amdahl(P) = 1 / ( s + (1 - s)/P ),S_gustafson(P) = s + (1 - s) * P,s 为串行份额。
  6. S62-42(G/G/m 近似等待时间)
    对 m 并行服务:W_q ≈ ( C * rho^sqrt(2(m+1)) / ( m * (1 - rho) ) ) * ( 1 / mu ),C = ( c_a^2 + c_s^2 ) / 2,rho = lambda / ( m * mu )。
  7. S62-43(优先级分数)
    • p(v) = ω1 * ( 1 / ( slack(v) + ε ) ) + ω2 * w(v) + ω3 * risk(v) + ω4 * age(v)。
    • 建议 ω1 ≥ ω2 ≥ 0,risk(v) 来自失败概率或重试成本。
  8. S62-44(通信切割成本)
    跨宿主切割 E_cut 的代价:CommCost = Σ_{e∈E_cut} vol(e) * lat(link) + Σ_{e∈E_cut} vol(e) / bw(link)。
  9. S62-45(DRF 份额)
    对租户 k,在资源 r 上的占比 sh_k^r = use_k^r / cap^r,主导资源份额 dom_k = max_r sh_k^r;调度按最小 dom_k 优先。

IV. 代价模型与就绪集


V. 启发式与放置规则


VI. 资源配额、隔离与弹性


VII. 数据与清单口径(调度与资源)


VIII. 算法与实现绑定(I60-* 扩展)


IX. 计量流程与运行图(Mx-6* 对应)

  1. Mx-67 schedule-compile-run
    • build_exec_graph → 估计 w(v), c(e) 与 dist_in/out;
    • plan_schedule 产出 p(v) 与初始放置;
    • allocate_resources 应用配额与亲和;
    • 事件循环:运行 → emit_metrics → apply_backpressure → 按需 autoscale。
  2. Mx-68 rescale-and-rebalance
    • 监测 ρ_hat、TS.latency.p99;
    • 触发 autoscale 与迁移;
    • 验证 hb 不变式与幂等补偿。
  3. Mx-69 incident-and-rollback
    • 告警升级与保护性降载;
    • 回滚到安全放置与 quota;
    • 产出事后报告与基线更新建议。

X. 观测、SLO 与告警


XI. 验证与测试矩阵

  1. 最小必测
    • Amdahl/Gustafson:构造不同 s,验证加速上界;
    • G/G/m:注入 c_a^2/c_s^2,验证 W_q 估计与 P99 预测;
    • 放置切割:对比启发式前后 CommCost 与 TS.latency.p99。
  2. 边界与极端
    突发流量与热点迁移;高配额冲突下的 DRF 公平性;GPU 稀缺与 NUMA 约束。
  3. 回归与门限
    锁定基线,比较 ΔT_make、ΔTS.util.*、ΔTS.queue.backlog、ΔTS.hb.violations 与成本变化。

XII. 交叉引用与依赖


XIII. 风险、限制与开放问题


XIV. 交付件与版本管理

  1. 交付件
    • 调度策略库(CP-first、HEFT、网络感知切割、DRF)、放置与迁移工具、autoscale 策略与看板配置。
    • 基准图谱与负载生成器、对照实验脚本与回归门。
  2. 版本管理
    自 v1.0 起冻结清单键名与指标集;新增策略以特性位控制,并附迁移说明。

XV. 本章新增术语与符号(记忆)


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/