当前位置: 首页 > Linux

LSTM学习前传

时间:2023-04-06 05:39:17 Linux

转发自:https://zhuanlan.zhihu.com/p/...DNN结构DNN(深度神经网络)的基本结构如下。其中x表示训练样本向量,y表示所需的输出向量。因此,一个基本的DNN网络是下图的形式。BackPropagation当DNN的结构设计好了,训练样本有了之后,再给出损失函数的定义,就可以计算出DNN中的参数W和b。.使用的算法本质上是梯度下降法,这里称之为BP(BackPropagation)算法。需要注意的是,DeepLearning中提到的BP与传统的BP并不完全相同。已经简化为纯梯度下降,更容易理解。下面也描述了这种方法。下图简单回顾一下链式法则求导。