深度學習入門教程UFLDL學習實驗筆記一：稀疏自編碼器

阿新 • • 發佈：2019-01-12

UFLDL即（unsupervised feature learning & deep learning）。這是斯坦福網站上的一篇經典教程。顧名思義，你將在這篇這篇文章中學習到無監督特徵學習和深度學習的主要觀點。

UFLDL全文出處在這：http://ufldl.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B，本文為本人原創，參考了UFLDL的教程，是我自己個人對於這一系列教程的理解以及自己的實驗結果。非盈利性質網站轉載請在文章開頭處著名本文作者：77695，來源http://www.cnblogs.com/cj695/。盈利性質網站轉載請與作者聯絡，聯絡方式在文章後面。如未聯絡，本人將通過一切可能且合法的途徑追繳相應稿酬。請在轉載時保留此宣告。

神經網路

一個神經網路由一系列神經元組成，一個神經元由一系列引數x1，x2。。。及偏置量+1作為輸入，將輸入與對應權值W（與x1,x2。。。相乘），（與1相乘）相乘後求和，並將和放入啟用函式，即可得到該神經元的輸出。我們稱這個神經元的輸入－輸出對映關係其實就是一個邏輯迴歸（logistic regression）

在這裡啟用函式我們用：

他的導數是右邊的形式

這是sigmoid函式的影象

整個神經元可以用一個公式表示：

神經網路就是很多個神經元組合在一起，一個神經元的輸出，也可以是另外一個神經元的輸入，如下圖：

具體請直接檢視UFLDL相應教程，這裡不再贅述，下文一樣。

反向傳導演算法

一個神經網路向前傳導，其神經元的引數可以是各種各樣的，這樣也會導致各種各樣的借，而我希望我整個神經網路的輸出，是與我預期的輸出越相近越好，為了描述相近的程度，我們計算神經網路輸出與預計輸出的差值的平方和。這個和越小，即輸出與預期越接近，我們稱這個叫做代價函式。但使得輸出與預期接近的W引數組合有很多，並不是每一種組合都好，也不是說越接近越好，當W引數太大的時候，會發生過擬合，使得泛化能力不夠，因此我們引入所有W的平方和，加入到代價函式中，我們稱它叫懲罰項。我們使用梯度下降法，求得最優的W，b這就是機器學習的整個過程。梯度下降中，其實就是求得代價函式對W，b的偏導值。在計算偏導的時候，因為複合函式的求導法則：

可以看到，要求整個懲罰函式的導數首先就要計算從懲罰函式開始向後求導，具體公式這裡就不貼了。

梯度檢驗

要檢測自己反向傳導得到的偏導函式是否正確，這裡有一種簡單粗暴的方法，就是梯度檢驗，通過對某一個引數加以及減一個較小的值的差除以2倍較小的值即可近似算出該點偏導值，因此可以用來檢驗偏導是否計算正確。但為什麼我們不直接用這個計算代替求偏導函式，因為太慢了！

在這裡我們用L-BFGS演算法快速計算偏導數

自編碼演算法與稀疏性

使得輸出儘可能與輸入一致我們稱之為自編碼。比如，若隱藏層神經元數目小於輸入層，則這個網路就要學習怎麼去壓縮這些資料。使得神經元大部分的時間都是被抑制的限制則被稱作稀疏性限制。其懲罰函式如下：

視覺化自編碼器訓練結果

可以證明，時有單元i有最大激勵。

實現

生成資料集：即從所有10副512x512的圖片中取8x8的塊，一共取10000塊。

這是資料集的一些圖片，可以看到這主要是一些自然圖片。

這裡只貼上所有自己實現部分的程式碼。

[w,h,n]=size(IMAGES);
randx=randi(w-patchsize,1,numpatches);
randy=randi(h-patchsize,1,numpatches);
randIdx=randi(n,1,numpatches);


for i=1 : numpatches
    pc=IMAGES(randx(i):randx(i)+patchsize-1,randy(i):randy(i)+patchsize-1,randIdx(i));
    patches(:,i)=pc(:);
end

生成結果如下：

實現懲罰函式以及梯度函式：按照之前的公式計算，大家直接看程式碼吧。

[l,n]=size(data);
dataHidden=sigmoid(W1*data+b1*ones(1,n));
dataOut=sigmoid(W2*dataHidden+b2*ones(1,n));
rou=sum(dataHidden,2)/n;
spCost=beta*(sum((sparsityParam*log(sparsityParam*ones(size(rou))./rou)...
    +(1-sparsityParam)*log(((1-sparsityParam)*ones(size(rou)))./(1-rou)))));
xyCost=(sum(sum((dataOut-data).*(dataOut-data))))/2/n;
wCost=(lambda/2)*((sum(sum(W1.*W1))+sum(sum(W2.*W2))));
cost=wCost+xyCost+spCost;
delta3=-(data-dataOut).*dataOut.*(1-dataOut);
spDt=beta*((-sparsityParam*ones(size(rou))./rou)+(((1-sparsityParam)...
    *ones(size(rou)))./(ones(size(rou))-rou)));
delta2=((W2')*delta3+spDt*ones(1,n)).*dataHidden.*(1-dataHidden);
W2grad=(delta3*(dataHidden'))/n+lambda*W2;
W1grad=(delta2*(data'))/n+lambda*W1;
b2grad=delta3*ones(n,1)/n;
b1grad=delta2*ones(n,1)/n;

實現時候出了一個問題，算梯度的時候少加了lambda*W1，粗心害死人啊！

梯度檢驗：按照公式實現梯度檢驗，檢驗實現的梯度是否正確。

for i=1 :(size(theta,1))
    e = zeros(size(theta));
    e(i)=EPSILON;
    cha=(J(theta+e)-J(theta-e));
    numgrad(i)=cha/(2*EPSILON);
end

看到執行結果

只差10^-12數量級，說明梯度檢驗的實現沒錯

訓練以及結果：

最後執行得到結果如下：

可以看到學習出來的結果基本是圖片相互正交的部分，相當於傅立葉變換中不同頻率正弦波，相當於很多正交的基，這些“基”以一定的權重相加，就能夠近似組成任何一個8x8的圖片塊。

另外值得一提的是，對於梯度下降演算法，在這裡使用的是L-BFGS演算法，對於這個演算法，我們不能將它用於商業用途，若用與商業用途的話，可以使用fminlbfgs函式，他比L-BFGS慢但可用於商業用途。

深度學習入門教程UFLDL學習實驗筆記一：稀疏自編碼器

神經網路

反向傳導演算法

梯度檢驗

自編碼演算法與稀疏性

視覺化自編碼器訓練結果

實現

生成資料集：即從所有10副512x512的圖片中取8x8的塊，一共取10000塊。

實現懲罰函式以及梯度函式：按照之前的公式計算，大家直接看程式碼吧。

梯度檢驗：按照公式實現梯度檢驗，檢驗實現的梯度是否正確。

訓練以及結果：

深度學習入門教程UFLDL學習實驗筆記一：稀疏自編碼器

深度學習入門教程UFLDL學習實驗筆記二：使用向量化對MNIST資料集做稀疏自編碼

深度學習入門教程UFLDL學習實驗筆記三：主成分分析PCA與白化whitening

深度學習筆記：稀疏自編碼器（1）——神經元與神經網路

tensorflow學習筆記(三)：實現自編碼器

DeepLearning學習隨記（一）稀疏自編碼器

UFLDL：稀疏自編碼器

ufldl 深度學習入門第一發：基於BP網路實現稀疏自編碼器

深度學習入門 ---稀疏自編碼器

csdn學習筆記一：lua 迭代器

【TensorFlow-windows】學習筆記六——變分自編碼器

系統學習深度學習（二） --自編碼器，DA演算法，SDA，稀疏自編碼器

『TensorFlow』讀書筆記_降噪自編碼器

UFLDL向量化程式設計練習：用MNIST資料集的稀疏自編碼器訓練實現

Deep Learning 16：用自編碼器對資料進行降維_讀論文“Reducing the Dimensionality of Data with Neural Networks”的筆記

深度學習入門---Keras報錯集合筆記

js學習入門教程筆記：css+html+js使用者註冊程式碼實現

基於PyTorch的深度學習入門教程（八）——影象風格遷移

《深度學習入門之pythoch》讀書筆記——卷積神經網路

基於PyTorch的深度學習入門教程（四）——構建神經網路

深度學習入門教程UFLDL學習實驗筆記一：稀疏自編碼器

神經網路

反向傳導演算法

梯度檢驗

自編碼演算法與稀疏性

視覺化自編碼器訓練結果

實現

生成資料集：即從所有10副512x512的圖片中取8x8的塊，一共取10000塊。

實現懲罰函式以及梯度函式：按照之前的公式計算，大家直接看程式碼吧。

梯度檢驗：按照公式實現梯度檢驗，檢驗實現的梯度是否正確。

訓練以及結果：

相關推薦