目录文档-技术白皮书22-EFT.WP.Metrology.Instrument v1.0

第14章 运行时监控与 SLO(健康度、漂移告警)


一句话目标:以标准化 SLI/SLO 与告警策略对仪器运行时健康、计量稳定性与分布漂移进行持续监控与闭环治理,保障长期可用、可追溯与可审计的计量链路。


I. 范围与对象

  1. 范围
    • 适用于通过 SCPI/IVI 接入的通用测量仪器在生产与实验环境中的长期运行监控。
    • 覆盖连接健康(会话/协议)、数据面健康(吞吐/丢包/时基)、计量健康(漂移/漂移率/不确定度)、合规健康(清单/签名/证书)。
  2. 输入
    • 运行遥测:session_open_latency_ms, cmd_roundtrip_ms, throughput_sps, sample_loss_rate, buffer_util, STB/SRQ, err_code。
    • 计量遥测:offset/skew/J, u(ts), U = k * u_c, SNR, gain, offset, temp, humidity。
    • 分布遥测:psi, KL, W1, q_score。
  3. 输出
    面板指标 panel.instrument.*、SLO 评估报告、分层告警与回退动作、manifest.instrument.sli 增量条目。

II. 名词与变量


III. 公设 P714-*


IV. 最小方程 S714-*


V. 监控流程 M70-14(采集→聚合→评估→告警/回退→落盘)

  1. 指标采集
    以滚动窗口 Delta_t 拉取运行遥测与计量遥测;对 ts 执行 align_timebase 并统计 offset/skew/J 与 u(ts)。
  2. 指标聚合
    • 计算 SLI:session_open_latency_ms_p95/p99, cmd_roundtrip_ms_p95/p99, throughput_sps, sample_loss_rate, ts_skew_p95, J_p95, err_rate, rho。
    • 计算计量与分布指标:U, SNR, gain/offset 漂移,psi/KL/W1。
  3. 契约评估
    运行 assert_instrument_contract 与本章 C70-14* 规则;执行 EWMA/CUSUM 与误警预算。
  4. 告警与回退
    分级触发:warn→minor→major→critical;对应限流、重配、重启会话、切换冗余或停止发布。
  5. 清单落盘
    写入 manifest.instrument.sli:窗口、口径版本、指标、告警、处置、TraceID、signature。

VI. 契约与断言 C70-14*(示例阈值口径)


VII. 实现绑定 I70-14*(接口原型、不变量)


VIII. 交叉引用


IX. 质量度量与风控

  1. 建议 SLI 名单
    • 可用性:uptime_pct, session_open_latency_ms_p99。
    • 性能:cmd_roundtrip_ms_p95/p99, throughput_sps, rho, buffer_util_p95。
    • 数据面:sample_loss_rate, ts_skew_p95, J_p95, u(ts)_p95。
    • 计量:U_p95, gain_drift_ppm_per_day, offset_drift_units, SNR_drop_db。
    • 质量与合规:scpi_error_rate, manifest_emit_latency_ms, signature_fail_rate。
  2. SLO 设定(示例)
    uptime_pct ≥ 99.9% / 30d;cmd_roundtrip_ms_p99 ≤ 50;sample_loss_rate ≤ 1e-4;ts_skew_p95 ≤ 1e-6 s;psi ≤ 0.1。
  3. 风控与回退
    • major:自动限流(降低 lambda)、缩短窗口、提高 BAND 宽带至稳定响应;
    • critical:切换冗余链路或备用仪器,冻结发布并触发人工校准;
    • 复原后执行 postmortem 与根因字段落盘:RCA.cause, RCA.fix, RCA.action_items。

小结


版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/