目录文档-技术白皮书07-EFT.WP.Core.Threads v1.0

第6章 资源配额与隔离


I. 范围与目标


II. 名词与变量


III. 公设 P76(资源与隔离)


IV. 最小方程 S76(容量与上界)


V. 资源域模型与参数化

  1. CPU
    • R_cpu 以 shares 或 vCPU 数标注;prio 决定在同域内的分配序。
    • 建议 headroom_cpu ∈ [0.1, 0.3];控制面与 crit(G) 采用固定核或高 share。
    • 合并短任务:批量化 w(v) 过小的节点以降低上下文切换开销。
  2. 内存
    • 申报 WSS:WSS = P95(working_set_samples);安全系数常取 safety_factor ∈ [1.2,1.5]。
    • 高水位与 OOM 策略:R_mem_high < R_mem_max;越界先触发节流与降级,再逐步回收缓存,最后中止最边缘线程。
  3. IO
    • 将 R_io 分为吞吐与 IOPS 两维:R_io = {MBps, IOPS};优先以 IOPS 限制小块抖动。
    • 写放大控制:顺序化 flush、合并小写、启用批 ACK;对日志路径单独设域。

VI. 隔离域与拓扑

  1. 逻辑分层
    • iso_dom(tenant) → iso_dom(gid) → iso_dom(thr);分别绑定 cgroup, cpuset, io.max。
    • 每层都有独立 quota 与 burst;跨层累计严格不超过上层。
  2. 亲和与 NUMA
    • affinity 固定在同一 NUMA 节点上;R_mem 对应节点预留;跨节点访问仅作为回退。
    • 对延时敏感链路设定 affinity = dedicated_cores,并禁用频繁迁移。

VII. 调度与入阈(与 I70-2)


VIII. 配额执行算法与策略


IX. 可观测性与告警(与 I70-7/I70-8)

  1. 指标
    • Threads.cpu.rho, Threads.io.rho, Threads.mem.wss, Threads.mem.oom_events
    • Threads.quota.throttle_ms, Threads.burst.active, Threads.numa.remote_ratio
  2. 门限
    • rho_cpu > 1 - headroom 持续 SLA_window/10 触发告警与自愈。
    • remote_ratio > 5% 于 crit(G) 触发亲和重排。
  3. 合同断言
    • {"type":"capacity_headroom","rho_cpu_le":1-headroom}
    • {"type":"wss_fit","WSS_le":R_mem/safety_factor}
    • {"type":"isolation","no_cross_tenant_contention":true}

X. 接口绑定(与 I70-5/I70-1/I70-2/I70-6)


XI. NUMA 最佳实践


XII. 故障围堵与恢复


XIII. 运行流程 Mx-5(上线步骤)


XIV. 交付件与验收标准


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/