1. 程式人生 > >基於matconvnet深度學習框架的方言分類(3)

基於matconvnet深度學習框架的方言分類(3)

續寫

在(2)中介紹了使用 matconvnet 中提供的examples中的可以訓練cifar資料庫的網路訓練自己的方言樣本資料。接下來介紹使用另外兩種網路 vggalexnet 這兩種網路模型也都較為經典。

vgg

vgg網路模型較為複雜一些,它可以分為vgg-fvgg-svgg-m 等。在這裡我使用的是vgg-f,因為相對而言vgg-f的網路結構簡單一些,也比較適用我們的資料。vgg-f 的網路模型在 imagenet 資料夾下,將程式中的模型名稱改為vgg-f之後,可以在GPU下使用該網路訓練自己的資料。vgg-f一般是用於做人臉分類和識別的,從名稱上即可看出。實驗的結果還是可以的,準確率可以達到90%左右,實驗結果圖如下:
這裡寫圖片描述

實驗資料說明:vgg-f 需要的實驗圖片大小為224*224,在程式執行之前,我們需要將樣本資料儲存到 mat 檔案下,但是可能由於某些記憶體限制,我們的21000張樣本不能一次儲存完成。因此我這次只儲存了14000張,即每個類的樣本為200張。

alexnet

alexnet的網路結構稍微複雜一些,但是alexnet作為經典網路模型,其實驗結果確實較為好一些。實驗需要改動程式碼的地方與之前提到的其他網路均相同,因此在這裡就不說了。下面展示一下實驗結果並說明一下實驗資料。

實驗1
剛開始每個類的樣本數量為200張,總共14000張樣本,實驗結果如下:

這裡寫圖片描述

實驗2
每個類的樣本數量為300張,總共21000張樣本,實驗結果如下:

這裡寫圖片描述

實驗結果說明:上述每個類的300張與之前採用的資料不一樣,該資料樣本是詞語樣本,之前所訓練的資料樣本均是單字。