ARIMA 深入：自回归差分移动平均的参数选择

FreeGuideOnline 最新 2026-06-24

ARIMA 模型深入：自回归差分移动平均的参数选择完全指南

在进行时间序列预测时，ARIMA 模型是最经典、应用最广泛的统计方法之一。然而，想要让模型真正发挥作用，正确选择其三个参数 (p, d, q) 是决定成败的关键。本教程将深入拆解 ARIMA 模型的参数含义，并系统讲解如何结合数据特征科学地选择最优参数组合。无论你是数据科学入门者，还是希望巩固理论基础的分析师，这篇指南都将为你提供清晰的路线图和可复用的实践方法。

什么是 ARIMA 模型？再谈三个参数

ARIMA 全称为 自回归差分移动平均模型 (Autoregressive Integrated Moving Average)。它由三个基本组件构成，分别对应三个核心参数：

AR(p)：自回归部分
描述当前值与过去 p 个时间步的值之间的线性关系。p 代表自回归的阶数，即使用多少个过去的观测值来预测现在。
I(d)：差分部分
表示为了使时间序列达到平稳而需要进行差分的次数。d 是差分的阶数，通常为 0、1 或 2。
MA(q)：移动平均部分
描述当前值与过去 q 个时间步的误差项（白噪声）之间的线性关系。q 是移动平均的阶数，即模型中使用多少个过去的预测误差来修正当前预测。

ARIMA(p, d, q) 就是这三个整数参数的组合，其数学本质是将非平稳序列通过 d 次差分转化为平稳序列，然后用 ARMA(p, q) 模型对转化后的序列建模。因此，整个参数选择过程的核心问题是：如何确定 d，使序列平稳？如何确定 p 和 q，使模型既精确又简洁？

差分阶数 d 的选择：让序列变平稳

ARIMA 假设基础序列是平稳的，即统计特性（均值、方差、自相关）不随时间变化。大多数现实世界的时间序列（如股价、销售额）都会呈现趋势或季节性，属于非平稳序列。差分是消除趋势最直接的工具。

判断平稳性的三种方法

肉眼观察时序图
如果序列显示出明显的向上或向下趋势，或者波动幅度随时间剧烈变化，它就是非平稳的。
自相关函数 (ACF) 图
对于一个平稳序列，ACF 会快速衰减至零附近。如果 ACF 图衰减非常缓慢，在多个滞后阶数上依然显著非零，则是强烈的非平稳信号。
单位根检验 (ADF 检验)
这是最客观的统计学方法。原假设 H₀ 为“序列存在单位根（即非平稳）”。如果 p 值 > 0.05，不能拒绝原假设，则序列非平稳，需要差分；当 p 值 < 0.05 时，可以认为序列已经平稳。

如何确定 d 的值

从 d = 0 开始，检验原始序列的平稳性。
若不平稳，执行 一阶差分（用当前值减去上一期值），再次用 ADF 检验。如果检验通过，则 d = 1。
若一阶差分后仍不平稳，则进行 二阶差分（在一阶差分的基础上再差分一次）。对于绝大多数经济和商业数据，d 不会超过 2。过度的差分会导致信息损失，并引入不必要的复杂度。

实践经验：观察差分后序列的 ACF/PACF 图时，如果差分后 ACF 仍然缓慢衰减，很可能 d 仍然不足；如果差分后 ACF 第一个滞后就剧烈负值，可能差分过度（d 可减 1 尝试）。

自回归阶数 p 与移动平均阶数 q 的选择

一旦序列平稳（即确定了 d），我们就可以专注于 ARMA(p, q) 的定阶。p 和 q 的选取主要依赖于 ACF（自相关函数）图 与 PACF（偏自相关函数）图 的形态特征。理解下述“截尾”和“拖尾”的视觉信号是参数选择的灵魂。

理论判断规则（Box-Jenkins 方法论）

模型类型	ACF 表现	PACF 表现
AR(p)	拖尾（指数衰减或正弦波衰减）	在 p 阶后截尾（突然变为零）
MA(q)	在 q 阶后截尾	拖尾
ARMA(p, q)	拖尾	拖尾

截尾：在某一阶之后，自相关系数突然落入置信区间内，不再显著非零。
拖尾：自相关系数不是突然变为零，而是逐渐衰减，可能呈指数下降或正弦波式震荡。

推导方法：

绘制平稳序列的 ACF 和 PACF 图（建议滞后至少 20 阶）。
观察 PACF 的截尾点 —— 如果 PACF 在滞后 p 之后明显截断，而在 p 之前各阶显著，则初步设定 AR 阶数为 p。
观察 ACF 的截尾点 —— 如果 ACF 在滞后 q 之后明显截断，则初步设定 MA 阶数为 q。
如果两者都拖尾，说明可能存在 ARMA 或更高阶结构，需要借助信息准则进一步筛选。

实例解析（无图文字模拟）

假设经过一阶差分后的平稳序列，其：

PACF 图：第 1、2 阶显著超出置信界，第 3 阶开始全部落入界内。 → 可设定 p=2。
ACF 图：第 1 阶显著，第 2 阶开始就变得不显著并一直保持低位。 → 可设定 q=1。

由此可得候选模型 ARIMA(2,1,1)。这只是理论初始值，最终模型必须通过诊断验证。

信息准则辅助的自动化参数选择

现实数据往往混杂噪声，ACF/PACF 的“截尾”并不总是清晰可见。此时，我们需要依靠 信息准则 来量化比较不同参数组合的优劣。最常用的两个准则：

AIC (赤池信息准则)
AIC = -2 log(L) + 2k
其中 L 是模型的极大似然值，k 是参数个数。AIC 越低越好，它在拟合优度和模型复杂度之间取得平衡。
BIC (贝叶斯信息准则)
BIC = -2 log(L) + k ln(n)
多考虑了样本量 n 的惩罚项，对复杂模型的惩罚比 AIC 更严厉，倾向于选择更简约的模型。

网格搜索策略： 在一个合理范围内（例如 p 和 q 均从 0 到 5），遍历所有可能的 (p, d, q) 组合（d 已提前固定或因数据趋势选择 0/1/2），计算每个模型的 AIC 或 BIC，选择使准则值最小的组合。这样做可以避免主观看图带来的误差，也更容易自动化。

不过需注意：AIC 最小化只是参考，还要结合模型残差是否通过白噪声检验，以及系数是否显著。若一个 ARMA(5,4) 的 AIC 仅比 ARMA(1,1) 小一点点，但伴随许多不显著的系数，我们应当倾向于简约模型。

模型诊断：参数选择后的最后防线

选定 (p, d, q) 并拟合模型后，必须诊断残差序列，以验证模型是否已充分提取信息。两个核心检验：

残差的白噪声检验 (Ljung-Box 检验)
原假设 H₀：残差序列是白噪声（无自相关）。我们希望 p 值 > 0.05，不能拒绝原假设，表示残差中没有遗留可预测的结构。如果某滞后阶数下 p 值很小，说明模型可能欠拟合，需要增加 p 或 q。
残差的 ACF/PACF 图
所有滞后阶数的自相关系数应全部落在置信区间（通常为 ±2/√n）内，不应有单一尖峰或明显模式。

此外，检查模型系数是否显著（p 值 < 0.05），并确保参数估计值落在平稳可逆的范围内（对于 AR(1)，系数绝对值 < 1；对于 MA(1)，同样条件）。如果出现不显著的高阶项，考虑移除相应参数重新拟合。

季节性与非季节性 ARIMA 的参数拓展

如果时间序列展现出明显的周期性季节模式（如每 12 个月的用电量、每周 7 天的交通流量），原生的 ARIMA(p, d, q) 就不够用了，需要扩展到季节性 ARIMA —— 通常表示为 ARIMA(p, d, q)(P, D, Q)s，其中大写 P, D, Q 是季节性对应的阶数，s 是季节周期长度。参数选择方法类似，但需要观察季节滞后点上的 ACF/PACF 形态。在基本掌握非季节性 ARIMA 参数选择后，季节性扩展就是一个自然的进阶方向。

实战建议与常见误区

先定 d，再定 p 和 q：很多初学者一上来就同时尝试改变 d、p、q，导致搜索空间爆炸且结果难以解释。应严格先通过平稳性检验固定 d，然后再选择 p 和 q。
不要过度依赖 AIC：AIC 只是相对比较，即使最低 AIC 的模型也可能出现残差有结构，必须进行诊断。
差分不是万能药：如果序列有明显的季节性，单纯差分（d=1 或 2）无法消除季节结构，需要季节性差分或使用 SARIMA。
样本量要求：p 和 q 选得过大需要较多数据支持，一般建议样本数至少为 50，对于复杂模型应有上百个观测点，否则参数估计不稳定。
从简约到复杂逐步尝试：先尝试 ARIMA(0,d,0) 或简单的 (1,d,0)、(0,d,1)，再根据残差表现决定是否扩展，这样能保持模型可解释性。

参数选择速查清单

原始序列作图观察趋势和季节性。
进行 ADF 检验，若 p>0.05，做差分，重新检验，直到平稳，记录差分阶数 d。
对平稳序列绘制 ACF 和 PACF 图。
根据截尾/拖尾特征初估 p、q。
在小范围（如 p,q ∈ [0,5]）内网格搜索，结合 AIC/BIC 选取候选模型。
检验最佳模型的残差是否为白噪声（Ljung-Box 检验 p>0.05）。
验证所有系数显著，无过拟合。
若有多套模型通过诊断，优先选择参数更少、更易解释的那一个。

掌握了这套系统化的选择流程，你就具备了将 ARIMA 模型应用到实际数据中的核心能力。参数的选择既是科学也是艺术，多练习、多感受不同数据特征下 ACF/PACF 的“语言”，便能越来越得心应手。