前两篇文章介绍了几种时间序列的直接预测方法。预测。要预测一个指标,首先要知道影响该指标的因素有哪些。如果现在领导让你预估一下下个月的销量,这个时候你会从哪些角度去考虑?即,哪些因素会影响下个月的销量?通常情况下,首先要考虑的因素是今年整体销售额与往年相比的增长情况。我们称这个因素为长期趋势;第二个因素是下个月是不是一年中的淡季还是旺季,一般业务都会分为淡季,我们称这个因素为季节性因素;与淡季类似,还有一个因素是周期因子,淡季是针对一年内的数据,周期因子是针对不同年份的,比如股市的熊市和牛市周期;前三个是已知因素,其实总会有一些其他的因素我们不知道,但是对指标有影响,根据实际情况,我们称这个因素为不规则因素。综上所述,一个时间序列可以分为四个部分:长期趋势(T)、季节性因素(S)、周期性因素(C)和不规则因素(I)。那么我们应该如何结合这四个因素呢?有两种组合:加法模型:Y=T+S+C+I乘法模型:Y=T*S*C*I如果每个因素对Y值的影响是独立的,则使用加法模型,否则a需要乘法模型。下面我们来看看如何获??取这些因子:1、首先,我们可以通过移动平均法计算出TC值,即长期趋势和周期因子;2、对TC值项用方程(线性、二次、指数、对数、多项式等)进行拟合,得到的拟合值为T;3、T值除以TC值,得到循环分量C的值;4.TC值除以序列值Y得到SI,即季节因子+不规则因子5.求过去几年同一季节的平均值,然后计算整个季节的总平均值,以及然后将整个赛季的总平均值除以每个赛季的平均值,得到的值就是每个赛季的Index值,需要保证每个赛季的Index之和等于4,如果是不是4,需要调整。最后用S值除以SI值就可以得到I值。在实际应用中,以上因素不一定同时存在,需要根据实际情况判断。以上是时间序列中各种因素的拆解。接下来我给大家举个例子:下表是2015年到2019年每个季度的GDP值,这是一个完整的时间序列。让我们看看如何拆解这个时间序列中的各种因素。先画个趋势图看看整体趋势:首先做第一步,计算均线。因为我们的数据具有严格的季节性,所以我们选择四期移动平均线。前面讨论了移动平均线的方法。不过,这里不再赘述。第二步是根据计算出的移动平均值拟合回归方程。因为趋势看起来是线性趋势,所以直接选择线性方程进行拟合。结果如下:第三步,用移动平均TC值除以Y值,得到SI值。第四步是找到季节性因素的S值。先来一张季节性因素的图:可以看到从每年的一季度到四季度,它一直在稳步上升。接下来,找到季节性因素的具体大小。其实就是一年中一个季节的比例。第五步,S值除以SI值,得到I值。最终的整体结果如下:我们也对2020年每个季度的GDP做了预测,也就是下图中的红线。每个季度的预测值等于该季度对应的TSC,因为每个值对应的I是不同的。所以我没有放进去。当然我也可以把不同季度的I值取平均值放进去。以上是下篇关于时间序列预测的内容。为了更深入的理解,大家一定要按照流程自己计算。
