目录文档-技术白皮书(V5.05)07-EFT.WP.Core.Threads v1.0

第6章 资源配额与隔离


I. 范围与目标


II. 名词与变量


III. 公设 P76(资源与隔离)


IV. 最小方程 S76(容量与上界)


V. 资源域模型与参数化

  1. CPU
    • R_cpu 以 shares 或 vCPU 数标注;prio 决定在同域内的分配序。
    • 建议 headroom_cpu ∈ [0.1, 0.3];控制面与 crit(G) 采用固定核或高 share。
    • 合并短任务:批量化 w(v) 过小的节点以降低上下文切换开销。
  2. 内存
    • 申报 WSS:WSS = P95(working_set_samples);安全系数常取 safety_factor ∈ [1.2,1.5]。
    • 高水位与 OOM 策略:R_mem_high < R_mem_max;越界先触发节流与降级,再逐步回收缓存,最后中止最边缘线程。
  3. IO
    • 将 R_io 分为吞吐与 IOPS 两维:R_io = {MBps, IOPS};优先以 IOPS 限制小块抖动。
    • 写放大控制:顺序化 flush、合并小写、启用批 ACK;对日志路径单独设域。

VI. 隔离域与拓扑

  1. 逻辑分层
    • iso_dom(tenant) → iso_dom(gid) → iso_dom(thr);分别绑定 cgroup, cpuset, io.max。
    • 每层都有独立 quota 与 burst;跨层累计严格不超过上层。
  2. 亲和与 NUMA
    • affinity 固定在同一 NUMA 节点上;R_mem 对应节点预留;跨节点访问仅作为回退。
    • 对延时敏感链路设定 affinity = dedicated_cores,并禁用频繁迁移。

VII. 调度与入阈(与 I70-2)


VIII. 配额执行算法与策略


IX. 可观测性与告警(与 I70-7/I70-8)

  1. 指标
    • Threads.cpu.rho, Threads.io.rho, Threads.mem.wss, Threads.mem.oom_events
    • Threads.quota.throttle_ms, Threads.burst.active, Threads.numa.remote_ratio
  2. 门限
    • rho_cpu > 1 - headroom 持续 SLA_window/10 触发告警与自愈。
    • remote_ratio > 5% 于 crit(G) 触发亲和重排。
  3. 合同断言
    • {"type":"capacity_headroom","rho_cpu_le":1-headroom}
    • {"type":"wss_fit","WSS_le":R_mem/safety_factor}
    • {"type":"isolation","no_cross_tenant_contention":true}

X. 接口绑定(与 I70-5/I70-1/I70-2/I70-6)


XI. NUMA 最佳实践


XII. 故障围堵与恢复


XIII. 运行流程 Mx-5(上线步骤)


XIV. 交付件与验收标准


版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05