浅说 Lstm
一 简介:
LSTM算法的全称是长短期记忆网络(long short–term memory),由LSTM算法对标准的RNN进行的改进,它规避了标准的RNN中的梯度爆炸和梯度消失的问题,学习速度更快。
二 原理
lstm 结构:
一个一个神经元首尾相接,同一层会把前面单元的输出作为后面单元的输入,前一层的输出会作为后一层的输入。
忘记门:
作用:将细胞状态中的信息选择性的遗忘, 即丢掉老的不用的信息
产生要更新的新信息:
更新细胞状态:
新细胞状态 = 旧细胞状态 × 忘记门结果 + 要更新的新信息
确定输出:
先确定细胞状态输出哪些部分:
确定输出部分:
三 案例