Recursive Autoencoders（遞迴自動編碼器）

阿新 • • 發佈：2018-10-31

1. 前言

今天主要介紹用在NLP中比較常見的AutoEncoder的模型，Recursive Autoencoders（遞迴自動編碼模型）。這篇文章主要討論RAE在序列化的資料中，如何把資料降維並且用向量表示。

2. 矩陣表示

假設我們有一個矩陣\(L\)的表示向量，一個有序的有\(m\)個元素的序列，每個元素有\(k\)維的向量表示，我們用\(b_k\)代表我們需要找的那個向量，公式如下：

\[ x_i=Lb_k \]

現在我們能用矩陣表示這個\(m\)個元素的序列了,\((x_1,x_2,x_3...,x_m)\)。

3. 非監督遞迴自動編碼器

上圖是RAE的二叉樹遞迴結構，最底層的節點\(x_1,x_2...,x_m\)

都是序列的內容。第一個RAE從在最底層最右邊的兩個孩子節點序列的元素\(x_1\)，\(x_2\)開始，對它們進行重構，會產生一個隱藏層\(y_1\)。再上層一點，一個節點是序列中的元\(x_i\)素，另一個節點是下一程節點通過AE的過程算出來的隱藏層向量\(y_i\)，經過RAE後，會產生隱藏節點\(y_{i+1}\)，如此迴圈直到序列中所有元素都進行了AE的過程。

編碼過程：父節點是\(y_1\)，兩個孩子節點是\(x_1\)和\(x_2\):

\[ \mathbf{y_1}=f(\mathbf{W}[\mathbf{x}_{1},\mathbf{x}_{2}]+\mathbf{b}) \]

解碼過程：通過父節\(y_1\)點再重構\(x_1\)和\(x_2\)

\[ [\mathbf{x}_{1}';\mathbf{x}_{2}']=\mathbf{W}'\mathbf{y_1}+\mathbf{b}' \]

損失函式

\[ E=\frac{1}{2}\Vert [\mathbf{x}_{1},\mathbf{x}_{2}]-[\mathbf{x}_{1}',\mathbf{x}_{2}']\Vert ^{2} \]
這個過程在每一個AE過程中重複，直到構造出整棵樹。

4. 優化

我們可以從幾個方面去優化RAE。

選擇一個好的方式去構造樹：我們構造二叉樹的方法很多。例如一個比較好的構造二叉樹的方式是用貪婪演算法在每一步去嘗試每個可能選擇孩子節點，最後選擇這一步重構損失最低的方式建樹。

選擇一個好的重構損失函式：前面我們的重構損失是平均的懲罰所有序列的損失值。假設我們可以包含孩子節點多的RAE過程的損失的權重比包含孩子節點少的RAE過程的損失函式的權重大。
歸一化：RAE計算的隱藏節點，它們後面會被下一個RAE重建。為了最小化重構的損失，RAE計算隱藏節點的時候可以對它進行歸一化。

5. 總結

本文主要介紹了RAE的構造和優化方向，下文將介紹RAE在相似度分析的應用。

（歡迎轉載，轉載請註明出處。歡迎溝通交流： [email protected]）

Recursive Autoencoders（遞迴自動編碼器）

1. 前言

2. 矩陣表示

3. 非監督遞迴自動編碼器

4. 優化

5. 總結

Recursive Autoencoders（遞迴自動編碼器）

7 Recursive AutoEncoder結構遞迴自編碼器(tensorflow)不能呼叫GPU進行計算的問題（非機器配置，而是網路結構的問題）

DenoisingAutoencoder（影象去噪自動編碼器）

16、【李巨集毅機器學習（2017）】Unsupervised Learning: Deep Auto-encoder（無監督學習：深度自動編碼器）

資料結構——棧的應用（遞迴經典：Hanoi）

HDU1698（遞迴建立線段樹）

斐波那契數列的python實現（遞迴與list實現）

51 Nod 1087 1 10 100 1000 （遞迴、二分查詢）

白話Variational Autoencoder（變分自編碼器）

簡單整數劃分（遞迴法+動態規劃法）

第三十九級臺階（遞迴遍歷搜尋）

全排列的不同方式（遞迴和STL演算法）

N皇后問題（遞迴和動態規劃）

全排列（遞迴與函式實現）

斐波那契數列（遞迴與迭代）

五、rm（遞迴刪除）、mkdir高階用法（遞迴建立資料夾）、mv 、cp、tar壓縮解壓

Java下實現無重字串的全排列（遞迴和回溯方法）

安科 OJ 1054 排隊買票（遞迴，排列組合）

執行緒（三）：Lock（互斥鎖）、RLock（遞迴鎖）、Semaphore（訊號量）、Event（事件）、Condition（條件）、Timer（定時器）、queue（佇列）

Performs recursive（遞迴） glob（全域性） with given suffix and rootdir，使用os.walk(rootdir)和filename.endswith(s

Recursive Autoencoders（遞迴自動編碼器）

1. 前言

2. 矩陣表示

3. 非監督遞迴自動編碼器

4. 優化

5. 總結

相關推薦