DL - LSTM

2021-05-10 18:57:16 作者：互联网

LSTM 长短记忆网络

LSTM 是 RNN 的升级版，应用更广泛。

解决的问题：

增加控制参数C，保留有价值的信息；

C 可以看做一个权重列表：[0, 0.1, 0.8, 1] 舍弃，小部分保留，大部分保留，全部保留。

LSTM 的重点是控制参数怎么更新

门是一种让信息选择式通过的方法
Sigmoid 神经网络层和一乘法操作

Sigmoid 公式：
g ( z ) = 1 1 + e − z g(z) = \frac{1}{1 + e^{-z}} g(z)=1+e−z1

Sigmoid 在负无穷到正无穷的范围类，数值在 0–1 之间；
描述每个部分多少量可以通过，0代表不允许任何量通过，1 代表允许任何量通过。

$ f_{t}=\sigma (W_{f} \cdot [h_{t-1}, x_{t} ]+b_{f} )$

$i_{t} = \sigma (W_{i} \cdot [h_{t-1}, x_{t} ] + b_{i} ) $

C ~ t = tanh ⁡ ( W C ⋅ [ h t − 1 , x t ] + b C ) \tilde{C}_{t} = \tanh (W_{C} \cdot [h_{t-1}, x_{t}]+b_{C} ) C~t=tanh(WC⋅[ht−1,xt]+bC)

$C_{t} = f_t * C_{t-1} + i_t * \tilde{C}_{t} $

o t = σ ( W o [ h t − 1 , x t ] + b o ) o_t = \sigma (W_o [h_{t-1}, x_t] + b_o) ot=σ(Wo[ht−1,xt]+bo)

h t = o t ∗ t a n h ( C t ) h_t = o_t * tanh(C_t) ht=ot∗tanh(Ct)

标签：DL,tanh,信息,ht,LSTM,sigma,Ct
来源： https://blog.csdn.net/weixin_45390999/article/details/116605540