当前位置: 首页 > 科技观察

金融领域常用深度学习模型盘点

时间:2023-03-19 15:46:31 科技观察

在我们今天发表的这篇文章中,作者SonamSrivastava介绍了金融领域的三个深度学习用例以及这些模型优缺点的证据。我们跟随SonamSrivastava的分析,展望金融深度学习的未来。尽管金融是计算最密集的领域,但广泛使用的金融模型:有监督和无监督模型、基于状态的模型、计量经济学模型甚至随机模型都存在过度拟合和启发式问题,抽样结果很差。由于金融生态系统极其复杂,其非线性充满了大量相互作用的因素。为了解决这个问题,如果我们考虑深度学习在图像识别、语音识别或情感分析方面所做的研究,我们会发现这些模型能够从大规模未标记数据中学习以形成非线性关系的递归结构,这可以很容易地调整以避免过度拟合。如果可以使用这些网络对金融生态系统进行建模,那么应用程序将是深入而广泛的。这些模型可用于定价、投资组合构建、风险管理甚至高频交易等领域,让我们来解决它们。ReturnForecasting以预测黄金每日价格的抽样问题为例,我们先来看看传统的方法。ARIMA模型ARIMA模型(AutoregressiveIntegratedMovingAveragemodel),微分积分移动平均自回归模型,又称积分移动平均自回归模型(移动也可称为滑动),时间序列预测分析方法之一。在ARIMA(p,d,q)中,AR是“自回归”,p是自回归项的个数;MA是“移动平均”,q是移动平均项的个数,d是使之成为平稳序列(Order)的差值个数。ARIMA的英文名称中没有出现“差分”二字,但却是关键的一步。ARIMA模型的基本思想是把预测对象随时间推移形成的数据序列看成一个随机序列,用一定的数学模型对这个序列进行逼近。这个模型一旦被识别,就可以根据时间序列的过去和现在的值来预测未来的值。现代统计方法和计量经济学模型已经能够在一定程度上帮助企业预测未来。使用积分移动平均自回归模型尝试预测季节性平稳时间序列,得到如下图所示的结果:VAR模型VAR模型,(VectorAutoregressionmodel)向量自回归模型,是一种常用的计量经济学模型,计量经济学家和宏观经济学家克里斯托弗·西姆斯。它扩展了只能使用一个变量的自回归模型(简称:AR模型)以容纳多个变量,因此常用于多变量时间序列模型的分析。如果我们将相关预测变量添加到我们的自回归模型并转移到向量自回归模型,我们将得到如下图所示的结果:深度回归模型如果我们对数据使用简单的深度回归模型,使用相同的输入,更好就会得到结果,如下图所示:卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,其人工神经元可以响应覆盖区域内的一部分周围单元,对于大图像表现优异加工。卷积神经网络由一个或多个卷积层和顶部的全连接层(对应于经典神经网络)以及相关的权重和池化层组成。这种结构使卷积神经网络能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网络在图像和语音识别方面可以给出更好的结果。该模型也可以使用反向传播算法进行训练。与其他深度前馈神经网络相比,卷积神经网络需要考虑的参数更少,这使其成为一种有吸引力的深度学习结构。修改我的架构,使用卷积神经网络来解决同样的问题,结果如下图所示:结果大大提升。但最终的结果还没有出来。LongShort-TermMemoryNetwork长短期记忆网络(LongShort-TermMemory,LSTM)是一种时间递归神经网络(RNN),论文***发表于1997年。由于独特的设计结构,LSTM适用于用于处理和预测具有很长间隔和时间序列延迟的重要事件。LSTM通常比时间递归神经网络和隐马尔可夫模型(HMM)表现更好,例如用于未分段的连续手写识别。2009年,用LSTM构建的人工神经网络模型在ICDAR手写识??别比赛中夺冠。LSTM也常用于自主语音识别,在2013年使用TIMIT自然语音数据库实现了创纪录的17.7%的错误率。作为一种非线性模型,LSTM可以作为复杂的非线性单元来构建更大的深度神经网络。使用循环神经网络(RNN)的变体,我得到了如下所示的结果:因此,总体而言,均方误差趋势是出乎意料的。投资组合构建我们试图使用深度学习解决的第二个财务问题是投资组合构建。在这个问题上,深度学习的实际应用效果很好。我的研究受到这篇论文的启发:《深度投资组合》(https://0x9.me/8uOBt)这篇论文的作者试图构建一个将时间序列映射到自身的自动编码器。使用这些自动编码器的预测误差成为股票beta(与市场相关)的代理,并且自动编码器被用作市场模型。自编码器是一种无监督学习算法,主要用于数据降维或特征提取。在深度学习中,自动编码器可用于在训练阶段开始前确定权重矩阵W。的初始值。根据上面autoencoder的误差选择不同的股票,我们可以使用另外一个深度神经网络来构建一个深度索引,结果还是比较不错的,如下图所示:使用股票的指数。但这只是它的开始!如果我们应用智能索引,当我删除指数的极端下降周期并在智能索引上训练我的指数映射深度神经网络时,我能够以惊人的速度超越指数!这项技术在投资组合空间中具有巨大的潜力!结论金融业的当前趋势是朝着更复杂和稳健的模型发展。随着数据科学家涌入该行业,技术对所有银行来说都是一个巨大的压力。像RelTec、Worldquant这样的对冲基金已经在他们的交易中使用了这种技术。由于这些复杂模型在其他领域所显示的优越结果,以及在金融建模领域的巨大差距,将会出现一系列戏剧性的创新!更好地解决金融和贸易领域的关键问题将提高效率、增加透明度、加强风险管理和新的创新。