1. 程式人生 > >超詳細的長短時記憶LSTM和門控迴圈單元GRU的反向傳播公式推導!

超詳細的長短時記憶LSTM和門控迴圈單元GRU的反向傳播公式推導!

門控迴圈單元GRU

長短時記憶LSTM

LSTM模型是用來解決simpleRNN對於長時期依賴問題(LongTerm Dependency),即通過之前提到的但是時間上較為久遠的內容進行後續的推理和判斷。LSTM的基本思路是引入了門控裝置,來處理記憶單元的記憶/遺忘輸入程度輸出程度的問題。通過一定的學習,可以學到何時對各個門開啟到何種程度,因為門控也是由有一定可以學習的引數的神經網路來實現的,這樣就可以讓機器知道何時應該記住某個資訊,而何時應該拋棄某個資訊。

不好意思,各位朋友,暫時沒空排版,先記錄下來,有空來排版一下!!! 

如果對DeepLearning的底層實現感興趣,可以到我的這篇部落格看看,相信會有很大幫助,謝謝!