11-EFT.WP.Core.DrawingKinetics v1.0 | 第12章基准算例与标定

目录／文档-技术白皮书（V5.05）／ 11-EFT.WP.Core.DrawingKinetics v1.0

第12章基准算例与标定

I. 范围与目标

建立可复现的牵引/拉伸基准算例族，用于验证几何与运动学（第2章）、守恒（第3章）、构成与张力演化（第4章）以及并发执行与计量流程（第8章与第10章）的落地一致性。
定义三类核心工况：恒速拉伸、阶跃拉伸、斜坡拉伸；给出输入口径、目标输出与评分合成规则，形成统一的 Mx-14 benchmark-report。
给出参数识别与标定流程，使 K_el,K_vis,theta 等构成参数在 ts 对齐与 hb 保障下可估、可复核、可追溯。

II. 术语与符号

基准与评分
- bench.id（基准编号），bench.type ∈ { const-speed , step-draw , ramp-draw }。
- score.total（总分），score.correctness（正确性），score.stability（稳定性），score.SLO（时序与并发SLO），score.throughput（吞吐），权重 w_c,w_s,w_o,w_t。
标定对象与参数
- 构成参数向量 theta = { K_el , K_vis , theta_aux[*] }；张力模型 T_fil( lambda , s ; theta )（第4章）。
- 观测集 y_obs = { T_fil(t) , v(t) , lambda(t) , s(t) , A(t) }，仿真/预测集 y_pred(.;theta)。
输入口径与窗口
- bc.*（边界条件，见第5章），window.id（时间窗），gamma(ell)（路径），d ell（测度）。
- 时基与因果：tau_mono，ts = alpha + beta * tau_mono，TS.hb。
无量纲与覆盖度
We,De,Re（覆盖分箱与报告字段），coverage[X]（X 的覆盖度评分，0..1）。

III. 公设与最小方程

P11-30（基准可复现）
任一 bench.id 必须以明确 bc.* , window.id , gamma(ell) , ts 以及传感器标定 Mx-11 的版本指纹唯一界定。
P11-31（评分单调与上界）
在同一数据上，增加物理约束或改进计量不会降低 score.correctness；所有子分项分数上界为 1。
P11-32（参数可识别域）
theta 的识别仅在 s(t) 与 lambda(t) 的激励覆盖度满足 coverage[s] >= c_min 时有效；否则应报告不可识别标识 flag.unidentifiable = true。
S12-40（参数识别目标函数）
- J_theta = ( ∑_{t ∈ window.id} w_T * ( T_pred(t;theta) - T_obs(t) )^2 + w_v * ( v_pred(t;theta) - v_obs(t) )^2 ) + R(theta)。
- 其中 R(theta) 为正则项（如 L2 或物理先验）；标定解 theta_hat = argmin_theta J_theta。
S12-41（评分合成）
- score.total = w_c * score.correctness + w_s * score.stability + w_o * score.SLO + w_t * score.throughput，且 w_c + w_s + w_o + w_t = 1。
- 缺省权重建议：w_c=0.45 , w_s=0.25 , w_o=0.20 , w_t=0.10。
S12-42（正确性子分）
score.correctness = 1 - min( 1 , rmse_T / gate_T_ref )，rmse_T = sqrt( mean_t ( T_pred - T_obs )^2 )，gate_T_ref 为门限参考张力。
S12-43（稳定性子分，频域口径）
定义张力抖动 sigma_T 与谱泄漏比 leak_ratio（第7章）：
score.stability = 1 - min( 1 , ( sigma_T / T_ref ) * k_sigma + leak_ratio * k_leak )，系数 k_sigma,k_leak 在 bench.card 声明。
S12-44（SLO 子分，线程与时基口径）
- 以第10章 TS.* 指标：
  score.SLO = 1 - min( 1 , ( TS.latency.p95 / L_ref ) * k_L + TS.hb.violations * k_hb + TS.backlog.max / B_ref )。
- 若 TS.hb.violations > 0 则 score.SLO = 0。
S12-45（吞吐子分）
score.throughput = min( 1 , R_eff / R_target )，R_eff 为有效样本处理率，R_target 为目标吞吐。
S12-46（守恒与归一化前置门）
若 gate.mass 或 gate.norm 未通过（第11章 S12-31,S12-32），则该 window.id 判为失效，score.total 不予计算。

IV. 数据与清单口径

bench.card（输入工况卡，必填字段）
- bench.id，bench.type，bc.inlet.{ v_in , lambda_in , T_in }，bc.outlet.{ v_out , lambda_out , T_out }，ramp.{ slope , duration } 或 step.{ amplitude , hold }。
- env.{ temperature , humidity }，gamma(ell) 参数化与支集，A(x,t) 的几何口径（传感器与模型对应关系）。
bench.metrics（输出与评分字段）
- rmse.T_fil，sigma_T，leak_ratio，TS.latency.p95，TS.backlog.max，R_eff，coverage[s]，coverage[lambda]，We,De,Re。
- score.* 与 w_*，gates.* 通过标记，flag.unidentifiable。
追溯与版本
timebase.alpha,beta，TS.hb.digest，Mx-11/12/13 的 method.id 与版本哈希，model.theta_hat 与 CI_p（第11章）。

V. 算法与实现绑定

I10-11 run_benchmark_case( bench_card:dict , params_init:dict ) -> dict
- 功能：执行指定基准算例的仿真与对照试验，输出 y_pred、y_obs、theta_hat 与中间校核。
- 契约：若 TS.hb.violations > 0 返回 E_THREADS_CASUALITY；若 gate.mass 失败返回 E_CONSERVATION_FAIL。
I10-12 score_benchmark( y_obs:any , y_pred:any , ts:SLO , gates:dict , refs:dict ) -> dict
- 功能：计算 score.* 与 score.total，并产出 bench.metrics。
- 契约：幂等；单位一致性失败返回 E_DIMENSION_MISMATCH。
I10-13 fit_constitutive_params( y_obs:any , model:any , priors:dict ) -> dict
- 功能：最小化 S12-40 得到 theta_hat 与不确定度评估（可用线性化或数值近似）。
- 契约：当 coverage[s] < c_min 返回 flag.unidentifiable=true 并给出可行域建议。
伪代码（核心流程）

I10-11 run_benchmark_case(card, params_init):

attach_timebase(card)

ensure_units_and_geometry(card)

y_obs <- acquire_or_load(card)

theta_hat <- I10-13.fit_constitutive_params(y_obs, model, priors)

y_pred <- simulate(model, card.bc, theta_hat)

gates <- I10-9.check_conservation( rho_L:J:trace_from(y_obs), card.window, card.path )

scores <- I10-12.score_benchmark(y_obs, y_pred, TS, gates, refs)

return {theta_hat:theta_hat, y_pred:y_pred, y_obs:y_obs, scores:scores, gates:gates}

VI. 计量流程与运行图

Mx-14 benchmark-report
- bootstrap：加载 bench.card，校核 ts 与 hb，锁定 env.* 与 gamma(ell)。
- pre-check：执行第11章门限 gate.mass 与 gate.norm。
- identify：调用 I10-13 获得 theta_hat 与 CI_p。
- simulate：在相同 bc.* 下生成 y_pred，并对齐到 ts。
- score：调用 I10-12 计算 score.* 与 score.total。
- report：写出 bench.report.json 与 qc.*、score.*、theta_hat、method.id、refs。
- publish：若 score.total >= score.min 且所有强制门通过，则标记可发布；否则进入回退与再标定分支。
回退策略
- flag.unidentifiable=true：改用增强激励（增加 step.amplitude 或 ramp.slope）或延长 hold。
- gate.spectrum.leak 超标：调整 window.id 或 U_w,ENBW 并重算。

VII. 验证与测试矩阵

基准清单与输入工况
- 恒速拉伸 const-speed：v(t)=v0，lambda(t)=lambda0 恒定；考察稳态守恒与抖动。
- 阶跃拉伸 step-draw：v(t)=v0 + Delta_v * H(t-t0) 或 lambda(t) 阶跃；考察瞬态响应与参数可识别性。
- 斜坡拉伸 ramp-draw：v(t)=v0 + r * ( t - t0 )；考察速率耦合与漂移鲁棒性。
指标族与通过线
- 正确性：rmse.T_fil <= gate_T_ref；
- 稳定性：sigma_T / T_ref <= k_sigma^{-1} 且 leak_ratio <= gate.spectrum.leak；
- SLO：TS.latency.p95 <= L_ref 且 TS.hb.violations == 0；
- 吞吐：R_eff >= R_target。
覆盖与分箱
对 We,De,Re 做多段分箱，要求每型基准至少覆盖两档；报告 coverage[*] 并计算覆盖扣分 penalty.coverage = max(0 , coverage_min - coverage[*])，并折算入 score.correctness。

VIII. 交叉引用与依赖

第2章：lambda,s,v,A 的定义与测度用于构造 bc.* 与激励覆盖度。
第3章：rho_L,J 的连续性用于 pre-check 守恒门。
第4章：T_fil 构成族与 theta 的识别目标函数。
第5章：入口/出口与夹持、滑移建模进入 bench.card 与仿真边界。
第7章：S_xx(f),U_w,ENBW 的谱口径支撑 leak_ratio 与稳定性评分。
第8章：Mx-11/12/13 的时基、校准与守恒校核作为 Mx-14 的前置环节。
第10章：TS.* 指标与 hb 约束进入 score.SLO。
第11章：误差预算与 CI_p 随 bench.report.json 一并发布。

IX. 风险、限制与开放问题

非线性强耦合与温度漂移可能导致 theta 的路径依赖；应在报告中附 env.* 与再标定建议。
当 A(x,t) 的测量误差与滑移同时存在时，T_fil 的识别可能呈多解；建议并用多工况联合拟合与先验约束。
重尾噪声会影响 rmse.T_fil 与频域稳定性评分一致性；可启用稳健损失或分位数口径并注明。
设备级 ts 对齐跨节点偏差未充分建模时，SLO 与正确性可能相互牵制；需在 qc.timebase.* 中记录来源与置信度。

X. 交付件与版本管理

交付件
- bench.report.json（包含 bench.card、theta_hat、CI_p、score.*、gates.*、coverage[*]、We,De,Re）。
- bench.methods.yaml（method.id、目标函数、窗口与谱口径、正则与超参）。
- bench.replay.manifest（数据切片、ts 映射、hb 证据、随机种子）。
- bench.changelog.md（权重、门限与工况变更）。
版本策略
- 权重或门限调整记为 MOD，影响评分的构成模型变更记为 ADD；任何导致评分不可比的修改必须给出迁移脚本与并行双算期。
- 发布前需通过第11章质量门，且 score.total >= score.min。

版权与许可：除另有说明外，《能量丝理论》（含文本、图表、插图、符号与公式）的著作权由作者（屠广林）享有。
许可方式（CC BY 4.0）：在注明作者与来源的前提下，允许复制、转载、节选、改编与再分发。
署名格式（建议）：作者：屠广林｜作品：《能量丝理论》｜来源：energyfilament.org｜许可证：CC BY 4.0
验证召集： 作者独立自费、无雇主无资助；下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地，不限国家。欢迎各国媒体与同行抓住窗口组织验证，并与我们联系。
版本信息： 首次发布：2025-11-11 ｜当前版本：v6.0+5.05