深度學習入門教程UFLDL學習實驗筆記二：使用向量化對MNIST資料集做稀疏自編碼

阿新 • • 發佈：2019-01-12

今天來做UFLDL的第二個實驗，向量化。我們都知道，在matlab裡面基本上如果使用for迴圈，程式是會慢的一逼的（可以說基本就執行不下去）所以在這呢，我們需要對程式進行向量化的處理，所謂向量化就是將matlab裡面所有的for迴圈用矩陣運算的方法實現，在這裡呢，因為之前的實驗我已經是按照向量化的形式編寫的程式碼，所以這裡我只把我對程式碼修改的部分發上來供大家參考吧。本文為本人原創，參考了UFLDL的教程，是我自己個人對於這一系列教程的理解以及自己的實驗結果。非盈利性質網站轉載請在文章開頭處著名本文作者：77695，來源http://www.cnblogs.com/cj695/。盈利性質網站轉載請與作者聯絡，聯絡方式在文章後面。如未聯絡，本人將通過一切可能且合法的途徑追繳相應稿酬。請在轉載時保留此宣告。

這是我們使用的資料集，採用的是MNIST資料庫裡面的手寫字元。讀取資料集有一定的方法，這個現成的程式碼在UFLDL的教程裡面是可以下載的。讀取完資料集顯示效果如下：

最後訓練得到的結果如下

程式碼第一處要修改的是在train的地方，要把引數修改為這次實驗的引數：

visibleSize = 28*28;   % number of input units 
hiddenSize = 14*14;     % number of hidden units 
sparsityParam = 0.1;   % desired average activation of the hidden units.
                     % (This was denoted by the Greek alphabet rho, which looks like a lower-case "p",
		     %  in the lecture notes). 
lambda = 0.003;     % weight decay parameter       
beta = 3;            % weight of sparsity penalty term

其次在computeNumericalGradient的地方，把梯度檢測數目減小：

for i=1 :min(size(theta,1),2)
    e = zeros(size(theta));
    e(i)=EPSILON;
    cha=(J(theta+e)-J(theta-e));
    numgrad(i)=cha/(2*EPSILON);
end

最後，取樣圖片，使用UFLDL提供的現成的讀取MNIST資料庫的函式即可：

function patches = sampleIMAGES()

img=loadMNISTImages('train-images.idx3-ubyte');
patches=img(:,10001:20000);
% patches = normalizeData(patches);
% 在實現手寫字元識別時，是不需要對其做歸一化處理的
end

注意：在做手寫字元識別時，使用MNIST的資料庫是不需要再對資料做歸一化處理的，如果做了歸一化處理，結果可能反而會出錯。

上圖是做了歸一化之後的結果，可以很明顯的看到，歸一化之後，每一個數字的格子之間的背景亮度是有一定差距的。

使用歸一化之後的資料經性訓練，最後得到的結果如下圖：

可以看到，這個結果與之前的結果比的話，並不能足矣用這些基來表達整個資料，因此是不好的。

為什麼會出現這樣一個結果呢，我們來看一下歸一化之後的結果：

下面是沒有歸一化的結果

可以看到沒有歸一化資料是從0-0.99的，變化範圍大，而歸一化後，資料變化範圍只有0.5，這顯然是不對的。要清楚的是，MINIST資料集本身就已經對資料進行了歸一化的處理因此我們就不用畫蛇添足了。

深度學習入門教程UFLDL學習實驗筆記二：使用向量化對MNIST資料集做稀疏自編碼

深度學習入門教程UFLDL學習實驗筆記二：使用向量化對MNIST資料集做稀疏自編碼

UFLDL向量化程式設計練習：用MNIST資料集的稀疏自編碼器訓練實現

深度學習入門教程UFLDL學習實驗筆記一：稀疏自編碼器

深度學習入門教程UFLDL學習實驗筆記三：主成分分析PCA與白化whitening

深度學習入門專案：用keras構建CNN或LSTM對minist資料集做簡單分類任務

Tensorflow學習教程------利用卷積神經網路對mnist資料集進行分類_利用訓練好的模型進行分類

tensorflow學習筆記(北京大學) tf5_1minst_forward.py 完全解析 mnist資料集

Bobo老師機器學習筆記第七課-使用PCA對MNIST資料集進行降噪

TensorFlow深度學習實戰（一）：AlexNet對MNIST資料集進行分類

tensorflow 學習專欄（四）：使用tensorflow在mnist資料集上使用邏輯迴歸logistic Regression進行分類

使用libsvm對MNIST資料集進行實驗

使用KNN對MNIST資料集進行實驗

使用Decision Tree對MNIST資料集進行實驗

hadoop2.x入門：編寫mapreduce對氣象資料集求每日最高氣溫和最低氣溫

WSWP（用python寫爬蟲）筆記二：實現連結獲取和資料儲存爬蟲

WebGL簡易教程(二)：向著色器傳輸資料

深度學習入門---Keras報錯集合筆記

js學習入門教程筆記：css+html+js使用者註冊程式碼實現

基於PyTorch的深度學習入門教程（八）——影象風格遷移

Deep Learning 2_深度學習UFLDL教程：向量化程式設計（斯坦福大學深度學習教程）

深度學習入門教程UFLDL學習實驗筆記二：使用向量化對MNIST資料集做稀疏自編碼

相關推薦