ThesignaldecompositionmethodsimilarEMD用于预测预处理是否存在原理问题许多学者使用各种信号分解方法来分解之后的信号,再进行时间序列预测,常用的方法有EMD(EmpiricalModeDecomposition)和ITD(IntrinsicTime-ScaleDecomposition)。问题:不过最近对于信号分解的方法应用于时间序列预测是否存在信息泄露问题众说纷纭,也有朋友遇到过类似的问题:LSTM+EMD信息泄露问题,那我就解释一下为什么是ITD而EMD等信号分解方法不适用于时间序列预测,这里以ITD为例进行公式探索。//本文仅陈述本人观点,能力有限,如有不妥请指正。//时间序列预测的本质:是利用历史数据对未来数据的猜测和估计,但是EMD、ITD等方法在分解信号时是利用未来数据对历史数据进行分解,因此存在信息泄露问题。【例子】以ITD原文链接为例,分解$X_t$信号时,提取基线信号$L_t$和残差信号$H_t$,其中:$$X_t=L_t+H_t$$$$L_{t}=L_{k}+\left(\frac{L_{k+1}-L_{k}}{X_{k+1}-X_{k}}\right)\left(S_{t}-X_{k}\right),\quadt\in\left(\tau_{k},\tau_{k+1}\right]$$$$L_{k+1}=\alpha\left[X_{k}+\left(\frac{\tau_{k+1}-\tau_{k}}{\tau_{k+2}-\tau_{k}}\right)\left(X_{k+2}-X_{k}\right)\right]+(1-\alpha)X_{k+1}$$其中,$τ_k$表示第$k$个极值对应的横坐标,可以是看到如果要分解前$(τ_k,τ_{k+1})$之间的信号,必须要用到$τ_{k+2}$的信息,也就是未来的信息。如果从graph,如上图所示,当得到了$τ_{j+1}$的值(实线),那么$τ_j$和它之前的数据(虚线)就可以分解了。如果我从图上解释一下我对ITD中信息泄漏的理解,如上图所示,当得到$τ_{j+1}$点的值(实线)时,$τ_j$和它之前的值可以被分解的数据(虚线)。这有悖于时间序列预测的本质,不适合先ITD分解,再训练+预测。与ITD类似,EMD需要提取未来的局部最大值。对于这个问题,ITD只出现在窗口的边缘,而EMD的问题可以清楚的反映整个窗口。参考文献[1]FreiMarkG和OsorioIvan2007Intrinsictime-scaledecomposition:time-frequency-energyanalysisandreal-timefilteringofnon-stationarysignalsProc.R.Soc。A.463321–342http://doi.org/10.1098/rspa.2...
