目录文档-技术白皮书11-EFT.WP.Core.DrawingKinetics v1.0

第12章 基准算例与标定


I. 范围与目标


II. 术语与符号

  1. 基准与评分
    • bench.id(基准编号),bench.type ∈ { const-speed , step-draw , ramp-draw }。
    • score.total(总分),score.correctness(正确性),score.stability(稳定性),score.SLO(时序与并发SLO),score.throughput(吞吐),权重 w_c,w_s,w_o,w_t。
  2. 标定对象与参数
    • 构成参数向量 theta = { K_el , K_vis , theta_aux[*] };张力模型 T_fil( lambda , s ; theta )(第4章)。
    • 观测集 y_obs = { T_fil(t) , v(t) , lambda(t) , s(t) , A(t) },仿真/预测集 y_pred(.;theta)。
  3. 输入口径与窗口
    • bc.*(边界条件,见第5章),window.id(时间窗),gamma(ell)(路径),d ell(测度)。
    • 时基与因果:tau_mono,ts = alpha + beta * tau_mono,TS.hb。
  4. 无量纲与覆盖度
    We,De,Re(覆盖分箱与报告字段),coverage[X](X 的覆盖度评分,0..1)。

III. 公设与最小方程

  1. P11-30(基准可复现)
    任一 bench.id 必须以明确 bc.* , window.id , gamma(ell) , ts 以及传感器标定 Mx-11 的版本指纹唯一界定。
  2. P11-31(评分单调与上界)
    在同一数据上,增加物理约束或改进计量不会降低 score.correctness;所有子分项分数上界为 1。
  3. P11-32(参数可识别域)
    theta 的识别仅在 s(t) 与 lambda(t) 的激励覆盖度满足 coverage[s] >= c_min 时有效;否则应报告不可识别标识 flag.unidentifiable = true。
  4. S12-40(参数识别目标函数)
    • J_theta = ( ∑_{t ∈ window.id} w_T * ( T_pred(t;theta) - T_obs(t) )^2 + w_v * ( v_pred(t;theta) - v_obs(t) )^2 ) + R(theta)。
    • 其中 R(theta) 为正则项(如 L2 或物理先验);标定解 theta_hat = argmin_theta J_theta。
  5. S12-41(评分合成)
    • score.total = w_c * score.correctness + w_s * score.stability + w_o * score.SLO + w_t * score.throughput,且 w_c + w_s + w_o + w_t = 1。
    • 缺省权重建议:w_c=0.45 , w_s=0.25 , w_o=0.20 , w_t=0.10。
  6. S12-42(正确性子分)
    score.correctness = 1 - min( 1 , rmse_T / gate_T_ref ),rmse_T = sqrt( mean_t ( T_pred - T_obs )^2 ),gate_T_ref 为门限参考张力。
  7. S12-43(稳定性子分,频域口径)
    定义张力抖动 sigma_T 与谱泄漏比 leak_ratio(第7章):
    score.stability = 1 - min( 1 , ( sigma_T / T_ref ) * k_sigma + leak_ratio * k_leak ),系数 k_sigma,k_leak 在 bench.card 声明。
  8. S12-44(SLO 子分,线程与时基口径)
    • 以第10章 TS.* 指标:
      score.SLO = 1 - min( 1 , ( TS.latency.p95 / L_ref ) * k_L + TS.hb.violations * k_hb + TS.backlog.max / B_ref )。
    • 若 TS.hb.violations > 0 则 score.SLO = 0。
  9. S12-45(吞吐子分)
    score.throughput = min( 1 , R_eff / R_target ),R_eff 为有效样本处理率,R_target 为目标吞吐。
  10. S12-46(守恒与归一化前置门)
    若 gate.mass 或 gate.norm 未通过(第11章 S12-31,S12-32),则该 window.id 判为失效,score.total 不予计算。

IV. 数据与清单口径

  1. bench.card(输入工况卡,必填字段)
    • bench.id,bench.type,bc.inlet.{ v_in , lambda_in , T_in },bc.outlet.{ v_out , lambda_out , T_out },ramp.{ slope , duration } 或 step.{ amplitude , hold }。
    • env.{ temperature , humidity },gamma(ell) 参数化与支集,A(x,t) 的几何口径(传感器与模型对应关系)。
  2. bench.metrics(输出与评分字段)
    • rmse.T_fil,sigma_T,leak_ratio,TS.latency.p95,TS.backlog.max,R_eff,coverage[s],coverage[lambda],We,De,Re。
    • score.* 与 w_*,gates.* 通过标记,flag.unidentifiable。
  3. 追溯与版本
    timebase.alpha,beta,TS.hb.digest,Mx-11/12/13 的 method.id 与版本哈希,model.theta_hat 与 CI_p(第11章)。

V. 算法与实现绑定

  1. I10-11 run_benchmark_case( bench_card:dict , params_init:dict ) -> dict
    • 功能:执行指定基准算例的仿真与对照试验,输出 y_pred、y_obs、theta_hat 与中间校核。
    • 契约:若 TS.hb.violations > 0 返回 E_THREADS_CASUALITY;若 gate.mass 失败返回 E_CONSERVATION_FAIL。
  2. I10-12 score_benchmark( y_obs:any , y_pred:any , ts:SLO , gates:dict , refs:dict ) -> dict
    • 功能:计算 score.* 与 score.total,并产出 bench.metrics。
    • 契约:幂等;单位一致性失败返回 E_DIMENSION_MISMATCH。
  3. I10-13 fit_constitutive_params( y_obs:any , model:any , priors:dict ) -> dict
    • 功能:最小化 S12-40 得到 theta_hat 与不确定度评估(可用线性化或数值近似)。
    • 契约:当 coverage[s] < c_min 返回 flag.unidentifiable=true 并给出可行域建议。
  4. 伪代码(核心流程)

I10-11 run_benchmark_case(card, params_init):

attach_timebase(card)

ensure_units_and_geometry(card)

y_obs <- acquire_or_load(card)

theta_hat <- I10-13.fit_constitutive_params(y_obs, model, priors)

y_pred <- simulate(model, card.bc, theta_hat)

gates <- I10-9.check_conservation( rho_L:J:trace_from(y_obs), card.window, card.path )

scores <- I10-12.score_benchmark(y_obs, y_pred, TS, gates, refs)

return {theta_hat:theta_hat, y_pred:y_pred, y_obs:y_obs, scores:scores, gates:gates}


VI. 计量流程与运行图

  1. Mx-14 benchmark-report
    • bootstrap:加载 bench.card,校核 ts 与 hb,锁定 env.* 与 gamma(ell)。
    • pre-check:执行第11章门限 gate.mass 与 gate.norm。
    • identify:调用 I10-13 获得 theta_hat 与 CI_p。
    • simulate:在相同 bc.* 下生成 y_pred,并对齐到 ts。
    • score:调用 I10-12 计算 score.* 与 score.total。
    • report:写出 bench.report.json 与 qc.*、score.*、theta_hat、method.id、refs。
    • publish:若 score.total >= score.min 且所有强制门通过,则标记可发布;否则进入回退与再标定分支。
  2. 回退策略
    • flag.unidentifiable=true:改用增强激励(增加 step.amplitude 或 ramp.slope)或延长 hold。
    • gate.spectrum.leak 超标:调整 window.id 或 U_w,ENBW 并重算。

VII. 验证与测试矩阵

  1. 基准清单与输入工况
    • 恒速拉伸 const-speed:v(t)=v0,lambda(t)=lambda0 恒定;考察稳态守恒与抖动。
    • 阶跃拉伸 step-draw:v(t)=v0 + Delta_v * H(t-t0) 或 lambda(t) 阶跃;考察瞬态响应与参数可识别性。
    • 斜坡拉伸 ramp-draw:v(t)=v0 + r * ( t - t0 );考察速率耦合与漂移鲁棒性。
  2. 指标族与通过线
    • 正确性:rmse.T_fil <= gate_T_ref;
    • 稳定性:sigma_T / T_ref <= k_sigma^{-1} 且 leak_ratio <= gate.spectrum.leak;
    • SLO:TS.latency.p95 <= L_ref 且 TS.hb.violations == 0;
    • 吞吐:R_eff >= R_target。
  3. 覆盖与分箱
    对 We,De,Re 做多段分箱,要求每型基准至少覆盖两档;报告 coverage[*] 并计算覆盖扣分 penalty.coverage = max(0 , coverage_min - coverage[*]),并折算入 score.correctness。

VIII. 交叉引用与依赖


IX. 风险、限制与开放问题


X. 交付件与版本管理

  1. 交付件
    • bench.report.json(包含 bench.card、theta_hat、CI_p、score.*、gates.*、coverage[*]、We,De,Re)。
    • bench.methods.yaml(method.id、目标函数、窗口与谱口径、正则与超参)。
    • bench.replay.manifest(数据切片、ts 映射、hb 证据、随机种子)。
    • bench.changelog.md(权重、门限与工况变更)。
  2. 版本策略
    • 权重或门限调整记为 MOD,影响评分的构成模型变更记为 ADD;任何导致评分不可比的修改必须给出迁移脚本与并行双算期。
    • 发布前需通过第11章质量门,且 score.total >= score.min。

版权与许可(CC BY 4.0)

版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。

首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/