01|时间序列的定义:时间序列是按照一定的时间间隔排列的一组数据,时间间隔可以是任何时间单位,如小时、天、周、月等。比如一个产品在不同时间段的用户数,用户在一个网站上的行为,这些数据形成一定时间间隔的数据。人们希望通过对这些时间序列的分析,发现和揭示现象发展变化的规律,从中提取尽可能多的信息,并利用这些知识和信息进行预测,掌握和预测未来的行为.对于时间序列的预测,由于很难确定它与其他变量之间的关系,此时不能用回归来预测,而应该用时间序列的方法进行预测。利用时间序列分析进行预测需要一系列模型,称为时间序列模型。使用该模型时,总是假设某种数据趋势会重现。02|时间序列分析的目的:系统描述,根据观察系统得到的时间序列数据,利用曲线拟合得到客观的描述;例如,2017年A产品销量的时间序列曲线是逐渐上升的趋势。系统分析,当观测值取自两个以上的变量时,可以用一个时间序列的变化来解释另一个时间序列的变化,从而解释两个变量随时间的变化;一个典型的例子是,随着时间的推移,新推出的产品A的销量逐渐增加,而产品B的销量逐渐下降。预测未来,通过拟合过去的时间序列数据,预测未来某个时间段的数据;典型的销售预测。决策与控制,根据时间序列模型调整输入变量,使系统开发过程保持在持续上升的状态,并在预测到目标值偏离目标时及时进行控制价值;典型的用户生命周期是用来尽可能缩短用户的成长周期,尽可能推迟用户衰退期的到来。03|时间序列的构成因素:时间序列的变化受多种因素影响。我们将众多影响因素按照对现象变化的影响类型分为以下几个因素来揭示时间序列变化的规律性:随着时间的推移。周期性是指现象随着时间序列的变化而表现出周期性的变化,就像正弦函数和余弦函数一样。不规则变化是指由于偶然因素的影响而表现出不规则波动的现象。04|时间序列的分类:根据研究对象的点数,有一维时间序列和多元时间序列。如果某个产品一年的销售数据是一元序列;如果研究序列不仅仅是一个序列,而是多个变量,即当一个时间点对应多个变量时,这个序列称为多变量时间序列,比如一天中某个时间的温度、气压和降雨量。根据时间的连续性,时间序列可以分为离散时间序列和连续时间序列。根据序列的统计特性,有平稳时间序列和非平稳时间序列。所谓稳定性,就是数据不会随着时间的推移而出现较大的波动。根据序列的分布规律,有高斯和非高斯时间序列两类。本文只是对时间序列的简单介绍。时间序列的分析方法还在研究阶段,以后再补充。
