其他分享
首页 > 其他分享> > GRU学习笔记

GRU学习笔记

作者:互联网

门控循环单元GRU学习笔记

比LSTM更简单的结构

只记住相关的观察需要:

  1. 更新门 -- 能关注的机制
  2. 重置门 -- 能遗忘的机制

,是和隐藏状态同样长度的向量。

下面公式中的几个参数:

  1. \(H_{t-1}\)是隐藏状态;
  2. \(X_t\)是输入;
  3. \(\sigma\)是有激活函数sigmod的fc层,输出范围[0,1]
  4. W是需要更新的权重矩阵
  5. b是偏置项

\(R_t\)是重置门(能遗忘的机制):\(R_t=\sigma(X_tW_{xr} + H_{t-1}W_{hr}+b_r)\)
\(Z_t\)是更新门(能关注的机制):\(Z_t=\sigma(X_tW_{xz} + H_{t-1}W_{hz}+b_z)\)
\(\widetilde{H}_t\)是候选隐藏门:\(tanh(X_tW_{xh}+(R_t⊙H_{t-1})W_{hh}+b_h)\)
\(H_t是隐状态:H_t=Z_t⊙H_{t-1}+(1-Z_t)⊙\widetilde{H}_t\)
GRU图

标签:GRU,--,tW,笔记,学习,widetilde,机制,sigma
来源: https://www.cnblogs.com/doubleyue/p/15735114.html