機器學習與Tensorflow（5）——迴圈神經網路、長短時記憶網路

阿新 • • 發佈：2019-01-06

1.迴圈神經網路的標準模型

前饋神經網路能夠用來建立資料之間的對映關係，但是不能用來分析過去訊號的時間依賴關係，而且要求輸入樣本的長度固定
迴圈神經網路是一種在前饋神經網路中增加了分虧連結的神經網路，能夠產生對過去資料的記憶狀態，所以可以用於對序列資料的處理，並建立不同時段資料之間的依賴關係
迴圈神經網路是一類允許節點連線成有向環的人工神經網路。如下圖：

2.迴圈神經網路與遞迴神經網路

從廣義上說，遞迴神經網路可以分為結構遞迴神經網路和時間遞迴神經網路
從狹義上說，遞迴神經網路可以通常就是指結構遞迴神經網路，而時間遞迴神經網路則被稱為迴圈神經網路

3.標準迴圈神經網路的結構型別（兩種）

不妨設t時刻，網路的輸入向量為x(t),隱含向量為h(t),網路的輸出向量是o(t),用V表示輸入層與隱含層之間的連線權值，U表示隱含層與隱含層之間的連線權值，W表示隱含層與輸出層之間的連線權值，b和a表示隱含層的輸出層的偏置

Elman網路：

網路結構如下圖：

Elman網路包含從隱含節點到上下文節點的反饋連結，以及從上下文節點調到隱含節點的前饋連結，其中上下文節點的輸入是隱含層上一時刻的輸出
Elman網路從0時刻到T時刻的計算過程可以描述為：

Jordan網路：

網路結構如下圖：

Jordan網路包含從輸出節點到上下文節點的反饋，以及從上下文節點到隱含節點的前饋連結，其中上下文節點的輸入是輸出層上一時刻的輸出。此外，Jordan網路的上下文節點允許自連線
Jordan網路從0時刻到T時刻的計算過程可以描述為：

4.長短時記憶網路（long short-term memory，LSTM）

長短時記憶網路(LSTM network)，又稱為長短時記憶迴圈網路，是一種在經典迴圈神經網路的基礎上發展起來的改進模型。
LSTM網路的特點在於利用記憶模組代替普通的隱含節點，確保梯度在傳遞跨越很多時間步驟之後不消失或爆炸，從而能夠克服傳統迴圈神經網路訓練中遇到的某些困難

長短時記憶網路非常適合於從經驗中學習分類，以及處理和預測那些在重要事件之間存在未知時長延遲的時間序列
迴圈神經網路和長短時記憶網路之間的對應關係如下圖所示：

5.傳統記憶塊組成

傳統記憶塊有一個或者多個具有內部狀態的記憶細胞（memory sell）、一個輸入擠壓單元（input squashing unit）、一個輸入門控單元（input gating unit）、一個輸入門單元（input gate unit）、一個輸出門單元（output gate unit）、一個輸出擠壓單元（outnput squashing unit）、和一個輸出門控單元（output gating unit）幾部分組成。

機器學習與Tensorflow（5）——迴圈神經網路、長短時記憶網路

1.迴圈神經網路的標準模型前饋神經網路能夠用來建立資料之間的對映關係，但是不能用來分析過去訊號的時間依賴關係，而且要求輸入樣本的長度固定迴圈神經網路是一種在前饋神經網路中增加了分虧連結的神經網路，能夠產生對過去資料的記憶狀態，所以可以用於對序列資料的處理，並建立不同時段資料之間

機器學習與Tensorflow（7）——tf.train.Saver()、inception-v3的應用

1. tf.train.Saver(） tf.train.Saver()是一個類，提供了變數、模型(也稱圖Graph)的儲存和恢復模型方法。 TensorFlow是通過構造Graph的方式進行深度學習，任何操作(如卷積、池化等)都需要operator，儲存和恢復操作也不例外。在tf.trai

機器學習與Tensorflow（1）——機器學習基本概念、tensorflow實現簡單線性迴歸

一、機器學習基本概念 1.訓練集和測試集訓練集(training set/data)/訓練樣例（training examples): 用來進行訓練，也就是產生模型或者演算法的資料集測試集(testing set/data)/測試樣例 (testing examples)：用來專門進行測試已經學習好

機器學習與Tensorflow（1）——機器學習基本概念、tensorflow實現簡單線性回歸

gradient 計算 gre alt ssi date upd tput test 一、機器學習基本概念 1.訓練集和測試集訓練集(training set/data)/訓練樣例（training examples): 用來進行訓練，也就是產生模型或者算法的數據集測試

機器學習與Tensorflow（3）—— 機器學習及MNIST資料集分類優化

一、二次代價函式 1. 形式：其中，C為代價函式，X表示樣本，Y表示實際值，a表示輸出值，n為樣本總數 2. 利用梯度下降法調整權值引數大小，推導過程如下圖所示：根據結果可得，權重w和偏置b的梯度跟啟用函式的梯度成正比（即啟用函式的梯度越大，w和b的大小調整的越快，訓練速度

機器學習與Tensorflow（6）——LSTM的Tensorflow實現、Tensorboard簡單實現、CNN應用

最近寫的一些程式以及做的一個關於軸承故障診斷的程式最近學習進度有些慢而且馬上假期要去補習班去賺下學期生活費額。。。。抓緊時間再多學習點 1.RNN遞迴神經網路Tensorflow實現程式 1 import os 2 os.environ['TF_CPP_M

機器學習與演算法（11）--彈性網路(Elastic Net)

彈性網路(Elastic Net) 彈性網路是一種使用 L1，L2範數作為先驗正則項訓練的線性迴歸模型.這種組合允許學習到一個只有少量引數是非零稀疏的模型，就像 Lasso一樣，但是

機器學習數學原理（5）——廣泛拉格朗日乘子法

機器學習數學原理（5）——廣泛拉格朗日乘子法這一篇部落格針對的是有約束的凸優化問題，主要是為後面的最優間隔分類器以及其演化的SVM（支援向量機，Support Vector Machine）演算法作鋪墊。Andrew Ng在講解最優間隔分類器時運用了廣泛拉格朗日乘子法但並沒有講的十

機器學習與演算法（6）--學習向量化

學習向量化學習向量量化（Learning Vector Quantization，簡稱LVQ），與1988

吳裕雄 python深度學習與實踐（5）

sci import array pat size ipy csv ima sta import numpy as np data = np.mat([[1,200,105,3,False], [2,165,80,2,False],

深度學習框架TensorFlow學習與應用（四）——擬合問題、優化器

一、擬合 1）迴歸問題：過擬合儘量去通過每一個樣本點，誤差為零。假如有一個新的樣本點：會發現過擬合的偏差會很大。 2）分類問題：同樣的當得到新的樣本點後，過擬合的錯誤率可能會提高。 3）防止過擬合： 1.增加資料集 2.正則化方

【機器學習】TensorFlow （二）優化器Optimizer

昨天整理了一下梯度下降演算法及其優化演算法，傳送門：https://blog.csdn.net/zxfhahaha/article/details/81385130 那麼在實戰中我們如何用到這些優化器，今天就整理一下TensorFlow中關於優化器Optimi

知識圖譜學習與實踐（5）——Protégé使用入門

1 Protégé簡介 Protégé是一個本體建模工具軟體，由斯坦福大學基於java語言開發的，屬於開放原始碼軟體。軟體主要用於語義網中本體的構建和基於本體的知識應用，是本體構建的核心開發工具，最新版本為5.5.0（截至2019年7月）。 Prot

機器學習回顧篇（5）：樸素貝葉斯演算法

1 引言說到樸素貝葉斯演算法，很自然地就會想到貝葉斯概率公式，這是我們在高中的時候就學過的只是，沒錯，這也真是樸素貝葉斯演算法的核心，今天我們也從貝葉斯概率公式開始，全面擼一擼樸素貝葉斯演算法。 2 貝葉斯概率公式 2.1 聯合概率與全概率公式定義1：完備事件組 ${A_1} \cup {A_2

Git的學習與使用（四）——Git 工作區、暫存區和版本庫

基本概念我們先來理解下Git 工作區、暫存區和版本庫概念工作區：就是你在電腦裡能看到的目錄。暫存區：英文叫stage, 或index。一般存放在 ".git目錄下" 下的index檔案（.git/index）中，所以我們把暫存區有時也叫作索引（index）。版本庫：工作區有一個隱

看懂論文的機器學習基本知識（三）--假正例、假負例、ROC曲線

一、假正例和假負例假正例（False Positive）：預測為1，實際為0的樣本假負例（False Negative）:預測為0，實際為1的樣本實際預測中，那些真正例（True Positive）和真負例（True Negative）都不會造成損失（co

深度學習框架Tensorflow學習與應用（5到8）

五. 03-1 迴歸 # coding: utf-8 # In[2]: import tensorflow as tf import numpy as np import matplotlib.pyplot as plt # In[3]: #使用numpy生成200個隨機點 x_

機器學習與深度學習系列連載：第二部分深度學習（十三）迴圈神經網路 1（Recurre Neural Network 基本概念）

迴圈神經網路 1（Recurre Neural Network 基本概念）迴圈神經網路的特點： • RNNs 在每個時間點連線引數值，引數只有一份 • 神經網路出了輸入以外，還會建立在以前的“記憶”的基礎上 • 記憶體的要求與輸入的規模有關當然，他的深度不只有一層：

機器學習 - 決策樹（下）- CART 以及與 ID3、C4.5的比較

機器學習 - 決策樹（下）- CART 以及與 ID3、C4.5的比較 CART 迴歸樹分類樹剪枝剪枝選擇決策樹特點總結 ID3，C4.

我的機器學習之旅（四）：回歸與工程應用

多個算法 ati function RR numpy pen 圖片 bsp 內容:線性回歸；邏輯回歸，應用場景。一、線性回歸有監督學習，根據學習樣本{x->y},學習一個映射f：X->Y(線性相關),輸出預測結果y_i。最簡單的例子：y=ax+b 重要組成

機器學習與Tensorflow（5）——迴圈神經網路、長短時記憶網路

1.迴圈神經網路的標準模型

2.迴圈神經網路與遞迴神經網路

3.標準迴圈神經網路的結構型別（兩種）

4.長短時記憶網路（long short-term memory，LSTM）

5.傳統記憶塊組成

相關推薦