目录 / 文档-技术白皮书 / 25-EFT.WP.STG.Dynamics v1.0
第7章 动力学识别(SINDy/Koopman/PINN/GN-ODE)
一句话目标:在 G=(V,E) 上给出从观测数据识别节点/边/全局动力学的统一口径,覆盖 SINDy/Koopman/PINN/GN-ODE,并以连续/离散两口径并行与契约化校核保障可追溯发布。
I. 范围与对象
- 对象
- 节点态 x_V(t) ∈ R^{N×d},边态(可选)z_E(t) ∈ R^{|E|×q},全局量 y(t) ∈ R^{r}。
- 采样与噪声:t_k = t_0 + k Δt,观测 x_k = x(t_k) + η_k。
- 拓扑与算子:A, B, L(见第2/4章),可用作先验或特征。
- 输入
数据窗 D = { (t_k, x_k) }、图 G、特征库与物理先验、RefCond、单位体系。 - 输出
- 连续时模型 dx/dt = f_θ(x, G) 或离散步模型 x_{k+1} = Φ_θ(x_k, G);
- 校核报告(误差、稳定性、物理约束)、delta_form_ident、manifest.stg.ident。
- 约束与边界
- unit(x), unit(t) = "[T]",unit(dx/dt) = unit(x)/[T] 显式;check_dim 必过。
- 若声明守恒/非负/能量单调,识别时需将其纳入损失或契约。
II. 名词与变量
- 采样与导数:Δt, x_k, ẋ_k(由数值微分估计),噪声 η_k。
- 模型族与参数:f_θ, Φ_θ, 稀疏系数 ξ,字典 Θ(x),Koopman 字典 Ψ(x),算子 K。
- 损失与度量:数据损失 L_data,物理残差 L_phys,正则 Ω(θ),两口径差 delta_form_ident。
- 参考字段:tau_mono, ts, RefCond, offset/skew/J(见《EFT.WP.Metrology.TimeBase v1.0》)。
III. 公设 P707-*
- P707-1(两口径并行):对任一识别结果,同时给出连续口径 f_θ 与离散口径 Φ_θ 的预测,记录差异。
- P707-2(测度显式):时间/谱/样本上的积分与和均显式:( ∫_{t} · dt )、( ∑_{k} · )。
- P707-3(单位一致):进入方程字段一律声明 unit(field) 与 dim(field),并通过 check_dim( y - f(x) )。
- P707-4(可解释优先):若业务需要,优先选择稀疏/线性于字典的模型(如 SINDy/EDMD),其系数、谱与不变量可审计。
- P707-5(拓扑一致):若模型涉及图算子,应与第2/4章定义的 B/L 等保持一致并落盘版本与哈希。
- P707-6(符号与冲突名):T_fil 与 T_trans 不混用;n 与 n_eff 严格区分;公式/符号/定义禁用中文。
IV. 最小方程 S707-*
- S707-1(SINDy 稀疏回归):
构造字典 Θ(x) = [ϕ_1(x), …, ϕ_M(x)],ẋ ≈ Θ(x) ξ,
稀疏解 ξ* = argmin_{ξ} ( || ẋ - Θ(x) ξ ||_2^2 + λ ||ξ||_1 ) 或 STLSQ。
若引入图特征:可扩展 Θ(x, Lx, …)。 - S707-2(Koopman/EDMD):
选取观测映射 g(x) = Ψ(x),拟合线性步进 g(x_{k+1}) ≈ K g(x_k),
K* = ( ∑_k g(x_{k+1}) g(x_k)^T ) ( ∑_k g(x_k) g(x_k)^T )^{†}。
连续化:A_c = (1/Δt) * log(K*)(分支选择与谱半径约束见契约)。 - S707-3(PINN):
设参数函数 x̂(t; θ) 或向量场 f_θ(x),定义残差
r(t) = d x̂ / dt - f_θ( x̂ ) 或 PDE 残差;
损失 L = w_d L_data + w_p ( ∑_t || r(t) ||_2^2 ) + Ω(θ),并可加入边界/守恒项。 - S707-4(Graph Neural ODE, GN-ODE):
连续时间消息传递
dx_i/dt = φ_vθ( x_i, ∑_{j} φ_eθ( x_i, x_j, e_{ij} ) ),
或含 L 的谱先验 dx/dt = f_θ(x) + Γ_θ(L)x。
数值解 x(t) = solver( f_θ, x(0), t )。 - S707-5(导数估计):
ẋ_k ≈ ( 1 / Δt ) * SavGol( x_{k-w..k+w} ) 或 TV-正则导数:
min_{ẋ} ( ∑_k || x_{k+1} - x_k - Δt ẋ_k ||_2^2 + α TV(ẋ) )。 - S707-6(两口径差定义):
x̂_cont(t_{k+1}) = Integrate( x_k, f_θ, Δt ),x̂_step(t_{k+1}) = Φ_θ(x_k),
delta_form_ident = || x̂_cont(t_{k+1}) - x̂_step(t_{k+1}) ||_2。 - S707-7(物理/拓扑约束项示例):
守恒:L_cons = || 1^T x̂(t_{k+1}) - 1^T x̂(t_k) - Δt 1^T s_k ||_2^2(见第6章);
同步:L_sync = max(0, r_min - r(x̂))(见第5章);
扩散能量:d/dt ( x^T L x ) ≤ 0 以软约束实现。
V. 计量流程 M7-7(就绪→建模/估计→校核→落盘)
- 就绪
- 对齐 tau_mono/ts,声明 unit(x), unit(t) 与 RefCond;
- 数据清洗与插值:缺测、离群、去噪(见附录/第12章面板规则);
- 估计导数 ẋ 并落盘导数方法与窗口。
- 建模/估计
- 选择模型族 {SINDy, EDMD, PINN, GN-ODE} 与先验(守恒/同步/扩散);
- 超参搜索:λ、字典规模 M、网络宽深、w_d/w_p、求解器容差;
- 训练/求解并得到 θ* / ξ* / K*。
- 校核
- 数据拟合:RMSE, R2, 时序残差自相关;
- 泛化:留出/滚动验证、扰动敏感度;
- 物理与拓扑契约(守恒/能量/同步);
- 谱与稳定:ρ(K*) < ρ_max,eig(A_c) 处于稳定域(按系统类型);
- 两口径差:delta_form_ident 的 p50/p95。
- 落盘/发布
manifest.stg.ident = {model, dict|arch, params_hash, Δt, deriv:{method,win,α}, metrics:{rmse,val_rmse,delta_p95}, physics:{contracts_pass}, spectra:{rhoK,maxReAc}, RefCond, seed, method.hash}。
VI. 契约与断言 C70-7xx
- C70-701(单位一致):check_dim( ẋ - f_θ(x) ) = "[0]" 或 check_dim( x_{k+1} - Φ_θ(x_k) ) = "[0]"。
- C70-702(导数质量):snr(ẋ) ≥ snr_min 且导数残差 p95 ≤ ε_diff(建议 ε_diff = 0.05·IQR(ẋ))。
- C70-703(拟合/泛化):val_rmse ≤ τ_val,且 overfit_gap = val_rmse - train_rmse ≤ τ_gap。
- C70-704(稀疏性/可解释):SINDy 非零比率 ≤ r_sparsity_max(默认 ≤ 0.2),同类项库相干度 μ(Θ) ≤ μ_max。
- C70-705(谱稳定):EDMD ρ(K*) ≤ ρ_max(默认 ≤ 1+1e-3);连续化 A_c 的实部约束按物理类型(扩散 ≤ 0,振子成对)。
- C70-706(两口径差):delta_form_ident_p95 ≤ tol_ident(建议 tol_ident = 1e-3·||x||_2)。
- C70-707(物理约束):被声明的守恒/单调/同步指标全部通过阈值;违约需标注 tags.violation.*。
- C70-708(可追溯):数据切片、清洗、导数与训练随机种必须可复现(seed/hash)。
VII. 实现绑定 I70-7*
- I70-71 estimate_derivative(ds, Δt, method, cfg) -> xdot, meta
- I70-72 sindy_fit(x, xdot, dict_spec, λ, solver) -> {ξ*, model, report}
- I70-73 edmd_fit(X, dict_spec, Δt) -> {K*, A_c, spectra, report}
- I70-74 pinn_train(data, phys_spec, arch, weights, solver) -> {θ*, loss_curve, report}
- I70-75 gnode_fit(G, X, arch, solver) -> {θ*, solver_meta, report}
- I70-76 stepper_from_cont(f_θ, solver, Δt) -> Φ_θ
- I70-77 check_ident_contracts(model, data, rules) -> report
- I70-78 emit_ident_manifest(results, policy) -> manifest.stg.ident
不变量:non_decreasing(time);RefCond/method/hash 可追溯;delta_form_ident ≤ tol_ident;check_dim 通过;若声明守恒则质量平衡可闭合。
VIII. 交叉引用
- 图算子/核与能量:见第2/4章(为字典与先验提供构件)。
- 同步与守恒契约:见第5/6章(可作为 L_phys 的约束项)。
- 数值稳定与时间步策略:见第9章。
- 运行发布与面板字段:见第14章;清单结构:见附录C。
- 数据清洗、两口径思想与契约风格:参考《EFT.WP.Metrology.PathCorrection v1.0》 第10/11章与附录B。
IX. 质量与风控
- SLI/SLO:val_rmse, delta_form_ident_p95, contracts_pass_rate, ρ(K*), maxRe(A_c), sparsity_rate, runtime_per_epoch。
- 回退策略
- 噪声高→增强去噪/导数稳健化(TV/SavGol),缩小字典或提高正则;
- 过拟合→增 Ω(θ)、早停、交叉验证、简化架构或降低字典阶;
- 谱不稳→缩小步长或对 K* 做谱裁剪,再连续化;
- 物理违约→强化物理损失权重或改先验(例如加入 L 扩散项)。
- 审计:落盘数据切片、清洗与导数参数、训练曲线与契约证据;对可解释模型输出项级报告与不确定度条形图。
小结
- 本章构建了在图结构系统上进行动力学识别的统一方法学:SINDy/EDMD/PINN/GN-ODE 的方程、损失与实现绑定,
以两口径 delta_form_ident、谱/物理契约与单位校核组成的闭环保障可发布性与跨场景复用。 - 产出键:manifest.stg.ident.*(模型族/结构、参数哈希、导数方法、误差与契约结果、谱与物理指标、RefCond)。
版权与许可(CC BY 4.0)
版权声明:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(“屠广林”先生)享有。
许可方式:本作品采用 Creative Commons 署名 4.0 国际许可协议(CC BY 4.0)进行许可;在注明作者与来源的前提下,允许为商业或非商业目的进行复制、转载、节选、改编与再分发。
署名格式(建议):作者:“屠广林”;作品:《能量丝理论》;来源:energyfilament.org;许可证:CC BY 4.0。
首次发布: 2025-11-11|当前版本:v5.1
协议链接:https://creativecommons.org/licenses/by/4.0/