在上一篇文章中,我们介绍的时间预测方法,基本上都是直接对历史数据进行平均计算。这篇文章讲了一些使用模型进行预测的方法。1.AR(p)模型首先,我们先说第一个AR模型。AR的全称是AutoRegression,意思是自动回归。大家应该都知道,普通的回归方程是用x来回归y的。在这里,x和y通常不是一回事。而我们这里的自回归,顾名思义就是利用自身回归自身,即x和y本身都是时间序列。具体模型如下:上述模型中,Xt表示t期的值,当前期的值由前p期的值决定,δ的值是一个常数项,相当于普通回归中的截距项,而μ是随机误差,因为当前值中总有一些因素我们没有考虑到,而这些因素带来的当前值的变化,我们把它放到μ部分。AR模型和我们前面提到的加权平均的区别在于有更多的常数项和误差项。2、MA(q)模型MA的全称是MovingAverage,意思是移动平均线。具体模型如下:上述模型中,Xt表示t期的值,当前期的值由前q期的误差值决定,μ的值是一个常数项,等价于为普通回归中的截距项,ut为当期的随机误差。MA模型的核心思想是每个周期的随机误差都会影响当前周期的值,而前q周期的所有误差相加就是对t周期值的影响。3.ARMA(p,q)模型ARMA模型实际上是以上两种模型的结合,也就是说t期的值不仅与前一个p期的x值有关,还与p期的x值有关每个周期对应前一个q周期的误差,这两部分共同决定当前周期t的值,具体模型如下:4.ARIMA(p,d,q)模型ARIMA模型是在ARIMA模型的基础上进行修改ARMA模型,ARMA模型是基于周期t的值。建模,而ARIMA是针对t周期和t-d周期之间的差异进行建模。我们将不同时期之间的这种差异称为差异,其中d是几个数量级的差异。仍然以gdp数据为例,下图是一阶差分和一阶差分后的结果:下图是一阶差分前后的gdp趋势图,可以看出实际gdp值继续上升,差值变成随机波动:ARIMA的具体模型如下:上式中的wt表示t期d阶差值的结果。我们可以看到,ARIMA模型的形式与ARMA基本相同,只是将X换成了w。5.最后,当数据为平稳时间序列时,可以使用前面三个模型。当数据是非平稳时间序列时,最后一个可以通过差分的方式将非平稳时间序列转化为平稳时间序列。以上是时间序列预测常用的统计模型。
