目录 / 文档-技术白皮书(V5.05) / 18-EFT.WP.Methods.CrossStats v1.0
第11章 时间序列与面板数据(ARIMA/State Space/ITS)
一句话目标:以 tau_mono 为统一时基,在 ARIMA、状态空间与 ITS 框架下完成趋势季节、干预与动态面板的可审计建模与预测,并以契约保障平稳性、残差白噪声与到达时一致。
I. 范围与对象
- 范围
- 单变量与多变量时间序列 y_t,含季节与节假日回归项;结构化状态空间模型与卡尔曼滤波;中断时间序列(ITS);静态与动态面板 y_{i,t}。
- 支持离线批与在线流式滚动预测、窗口 Delta_t 与多步预测 h。
- 对象
- 输入:D = { (y_t, x_t, ts_t, m_t) } 或面板 D = { (y_{i,t}, x_{i,t}, ts_{i,t}, i) },缺失掩码 m ∈ {0,1},对齐元数据 offset/skew/J。
- 输出:模型参数、诊断面板、预测 hat{y}_{t+h} 与区间、manifest.stats.ts.*。
II. 名词与变量
- 滞后与差分:L y_t = y_{t-1},(1 - L)^d y_t;季节差分 D_s(L) = (1 - L^s)^D。
- ARIMA:phi(L),theta(L);季节多项式 Phi(L^s),Theta(L^s)。
- 状态空间:x_t(状态),A,B,C,D,Q,R;过程噪声 w_t ~ N(0,Q),观测噪声 v_t ~ N(0,R)。
- ITS 指示:I_t = 1(t ≥ T0),斜率交互 I_t * (t - T0)。
- 面板效应:个体固定效应 alpha_i,时间效应 lambda_t,动态系数 rho。
- 残差与诊断:e_t = y_t - hat{y}_t,ACF_k,LB_p(Ljung-Box 统计),NRMSE,PI_coverage。
III. 公设 P311-*
- P311-1(时基一致):建模窗口在 tau_mono,发布以 ts,附 offset/skew/J;若使用到达时量 T_arr,两口径与 delta_form 并行记录。
- P311-2(单位与量纲):声明 unit(y), dim(y);所有回归系数通过 check_dim( y - f(x) )。
- P311-3(平稳与可逆):AR 多项式根在单位圆外、MA 多项式可逆;状态空间谱半径 max_abs_eig(A) < 1(稳定情形)。
- P311-4(缺失策略显式):m=0 的点使用明确的插补或滤波预测,不允许隐式填值。
- P311-5(面板独立性与聚类):误差聚类于 i 或 i,t,方差估计采用一致性稳健口径。
- P311-6(干预因果顺序):ITS 干预 I_t 与协变量 x_t 发生时间早于响应 y_t。
IV. 最小方程 S311-*
- S311-1(ARIMA/SARIMA)
phi(L) * Phi(L^s) * (1 - L)^d * (1 - L^s)^D y_t = theta(L) * Theta(L^s) * epsilon_t,epsilon_t ~ WN(0, sigma^2)。 - S311-2(状态空间)
- 状态:x_t = A x_{t-1} + B u_t + w_t;观测:y_t = C x_t + D u_t + v_t。
- 卡尔曼预测:x_{t|t-1} = A x_{t-1|t-1};P_{t|t-1} = A P_{t-1|t-1} A' + Q。
- 更新:K_t = P_{t|t-1} C' ( C P_{t|t-1} C' + R )^{-1};x_{t|t} = x_{t|t-1} + K_t ( y_t - C x_{t|t-1} )。
- 对数似然:logL = -0.5 * ∑ ( log|S_t| + e_t' S_t^{-1} e_t + const ),S_t = C P_{t|t-1} C' + R。
- S311-3(ITS 基式)
y_t = beta0 + beta1 * t + beta2 * I_t + beta3 * I_t * ( t - T0 ) + gamma' z_t + epsilon_t;epsilon_t 可按 ARMA 结构拟合。 - S311-4(面板 FE/RE 与两向固定效应)
y_{i,t} = alpha_i + lambda_t + beta' x_{i,t} + e_{i,t};alpha_i 固定或随机;稳健方差按聚类口径计算。 - S311-5(动态面板 Arellano-Bond)
y_{i,t} = rho * y_{i,t-1} + beta' x_{i,t} + eta_i + e_{i,t};差分后以内生滞后作工具,GMM 估计,Hansen_p ≥ p_min。 - S311-6(预测与区间)
一步预测:hat{y}_{t+1|t};多步:递推 x_{t+h|t} = A^h x_{t|t};区间基于创新方差叠加或样本外自助。 - S311-7(残差白噪声与覆盖度)
LB_p pval ≥ p_min;PI_coverage ≈ target;ACF_k 在置信带内。
V. 统计流程 M30-11(就绪→建模→诊断→发布)
- 就绪
time_align_for_stats 完成 tau_mono 对齐与节假日特征;声明 unit(y) 与窗口 Delta_t;缺失与异常处理完成。 - 模型候选与定阶
对 y_t 做差分检验,ACF/PACF 与信息准则选型;或以结构化状态空间起步(局部线性趋势、季节、回归项)。 - 拟合与估计
fit_arima 或 fit_state_space(卡尔曼滤波/平滑),ITS 加入水平与斜率断点项;面板按 FE/RE 或动态 GMM。 - 诊断与调参
残差白噪声、稳定性、参数界、面板聚类稳健方差、预测区间覆盖度;必要时引入 exogenous x_t 或变换。 - 预测与滚动评估
生成 hat{y}_{t+h} 与区间,滚动窗口计算 NRMSE/MAE/CRPS;输出 latency_ms_p99 与资源占用。 - 发布与落盘
emit_ts_manifest 写入模型签名、参数、诊断、SLO、TraceID 与到达时两口径 delta_form(如使用)。
VI. 契约与断言 C30-111x
- C30-1111(平稳/可逆):roots(phi) outside unit circle 且 roots(theta) outside unit circle;状态空间 max_abs_eig(A) < 1 或明确非常态说明。
- C30-1112(残差白噪声):LB_p pval ≥ 0.05 且 max_k |ACF_k| ≤ band_k。
- C30-1113(覆盖度与误差):PI_coverage ∈ [target - tol_cov, target + tol_cov];NRMSE ≤ tol_nrmse。
- C30-1114(面板稳健性):聚类稳健 SE 有界;Hansen_p ≥ 0.05(动态 GMM);无二阶自相关 AR(2) pval ≥ 0.05。
- C30-1115(时基一致与到达时):若模型含 T_arr,断言 delta_form ≤ tol_Tarr;offset/skew/J ≤ policy.max。
- C30-1116(资源与延迟):latency_ms_p99 ≤ SLO_latency;内存占用与模型大小不超配额。
VII. 实现绑定 I30-*
- I30-111 time_align_for_stats(ds, sync_ref) -> ds'(附 offset/skew/J 与两口径字段)
- I30-112 fit_arima(y, x_exog, order, seasonal) -> model
- I30-113 fit_state_space(y, ss_spec) -> {A,B,C,D,Q,R,init}
- I30-114 fit_its(y, t, T0, z, arma_spec) -> model
- I30-115 fit_panel_fe(ds, two_way, cluster) -> model
- I30-116 fit_panel_gmm(ds, spec) -> {params, hansen_p, ar2_p}
- I30-117 forecast_ts(model, h, exog_future) -> {y_hat, PI}
- I30-118 residual_diagnostics(model) -> {LB_p, ACF_band, NRMSE, PI_coverage}
- I30-119 evaluate_ts_contracts(report, rules) -> contract_report
- I30-11A emit_ts_manifest(results, policy) -> manifest.stats.ts
不变量:manifest.stats.ts.TraceID 唯一;contract_report.pass == true 方可发布;unit(y_hat) == unit(y);滚动评估窗口覆盖率 ≥ cov_min。
VIII. 交叉引用
- 时间轴与同步:见《Methods.Cleaning v1.0》第5章。
- 到达时两口径与路径:见《Methods.Cleaning v1.0》第6章。
- 多重比较与序贯预算(多窗口报警):见本卷第6章。
- 漂移检测与基线更新:见本卷第7章。
- 成像时序与到达时一致:见《Methods.Imaging v1.0》第13章。
IX. 质量与风控
- SLI/SLO
LB_p pval ≥ 0.05;PI_coverage@0.95 ≥ 0.92;NRMSE ≤ target;latency_ms_p99 ≤ 500;retrain_interval_days ≤ 14。 - 风控
失败路径:若 C30-1112 不通过,增加阶数或重设状态噪声 Q,R;若 C30-1114 失败,减少工具数量或更换矩条件;若漂移超阈,触发再训练与参数冻结回退。
小结
本章提供 ARIMA、状态空间与 ITS 的统一口径,自就绪到发布的闭环流程 M30-11;以 C30-111x 契约约束平稳性、诊断与覆盖度,并与时基同步、到达时两口径及漂移监测协同,产出可审计的时间序列与面板预测结果与清单。版权与许可:除另有说明外,《能量丝理论》(含文本、图表、插图、符号与公式)的著作权由作者(屠广林)享有。
许可方式(CC BY 4.0):在注明作者与来源的前提下,允许复制、转载、节选、改编与再分发。
署名格式(建议):作者:屠广林|作品:《能量丝理论》|来源:energyfilament.org|许可证:CC BY 4.0
验证召集: 作者独立自费、无雇主无资助;下一阶段将优先在最愿意公开讨论、公开复现、公开挑错的环境中推进落地,不限国家。欢迎各国媒体与同行抓住窗口组织验证,并与我们联系。
版本信息: 首次发布:2025-11-11 | 当前版本:v6.0+5.05