【Machine Learning】【Python】一、HoG + SVM 物體分類 ---- 《SVM物體分類和定位檢測》

阿新 • • 發佈：2019-01-13

----------【2018.09.07更新】---

如果你看到了這篇文章，並且從github下載了程式碼想走一遍整個流程。我強烈建議你把《SVM物體分類和定位檢測》這一系列的6篇文章都仔細看一遍。內容不多，但會對你理解演算法和程式碼有很大的幫助。

----------【2018.01.22更新】----降維演算法-----

看了一篇文章介紹t-SNE降維演算法的，文章中給出的資料效果比PCA好點，大家可以嘗試看看。

文章地址

--------【2017.12.22更新】----流程說明------

總結一下我用著最好的方法流程吧。

1. 先HoG提取特徵features。

2. PCA對features降維，然後用PSO優化引數C和gamma。降維的目的是加快PSO執行速度，否則太慢，但分類效果降低。

3. 用第一步拿到的features和第二步拿到的引數訓練一個初始SVM模型。

4. Hard Negative Mining優化SVM模型。

5. 進行滑窗detection，最後NMS邊框迴歸。

目前2700正樣本，2700負樣本。測試集1200負樣本，700正樣本。

----------------------------------------------------------

最近在研究傳統方法的物體分類，使用的方法是Hog + SVM，不過分類正確率不是很高。我寫一寫心得體會。

首先宣告我不會具體將原理。因為網上資訊太多了，大家自己先看看大致瞭解了再看這篇文章。

一、HoG特徵數計算

先說一下兩個引數：

1. pixels of a cell

2. cells of a block

HoG是對圖片進行滑框提取特徵的，block就是這個框。block裡有cell，在cell中進行特徵提取。將bolck中所有cell 的特徵整合在一起，就是這個block的特徵。再將所有block的特徵整合一起就是整張圖片的特徵了。

HoG在cell中提取特徵的時候可以理解成是按角度來的，一般分9組，一組有40度，9組一共360度。每一組就代表一個特徵值。那麼我們就可以計算整張圖的特徵數了。

對於一張 300 × 600 的圖片，我定義每個cell裡畫素是 15 × 15，每個block裡有2 × 2個cell，圖片一共有 10 × 20 個block

一個cell： 9 個特徵

一個block： 4 × 9 = 36 個特徵

圖片一共有： 10 × 20 × 36 = 3600 個特徵

二、說明

如果不對圖片進行處理而直接丟如HoG的話，背景等因素會對最後提取的特徵造成很大的不好影響。所以我提供的提取特徵值的程式碼中包含兩部分，一部分是根據xml檔案中bbox資訊切割出物體進行特徵提取。另一部分是直接對整圖進行特徵提取。因為最後的特徵值數量和輸入圖片大小有關，所以要對切割後的圖片和整圖統一resize到固定大小。更多細節看程式碼中註釋。

路徑說明：

./train/positive # 存放需要切圖的帶分類物體的訓練集

./test/positive # 存放帶分類物體的測試集

./train/positive_rest # 存放不需要切圖的帶分類物體的訓練集

./train/negative # 存放不帶分類物體的訓練集

./test/negative # 存放不帶分類物體的測試集

後記

我是從ILSVRC拿的圖片，訓練集8000多張，正樣本和負樣本一種一半。測試集2000多張圖片，正負樣本各一半。後續我又做了PCA，對正確率沒什麼影響，會增加模型的魯棒性。下一篇我文章我放出加上PCA的程式碼。做PCA主要是後來我選擇PSO求解最優化SVM引數C和gamma需要把特徵降維，否則計算量太大。

【Machine Learning】【Python】一、HoG + SVM 物體分類 ---- 《SVM物體分類和定位檢測》

一、HoG特徵數計算

二、說明

後記

【Machine Learning·機器學習】決策樹之ID3演算法(Iterative Dichotomiser 3)

【Machine Learning】【Python】一、HoG + SVM 物體分類 ---- 《SVM物體分類和定位檢測》

【Machine Learning】【Python】三、PSO + PCA優化SVM引數C和gamma ---- 《SVM物體分類和定位檢測》

【machine learning】GMM演算法（Python版）

【Machine Learning】Python開發工具：Anaconda+Sublime

【Machine Learning】決策樹案例：基於python的商品購買能力預測系統

【Machine learning（python篇)】-幾種常用的資料結構

【Machine Learning】【Python】選擇最優引數(Decision Tree, Random Forest, Adaboost, GBDT)

【Machine Learning】【Python】五、Sliding Window + SVM + NMS for Localization ---- 《SVM物體分類和定位檢測》

第十週（大規模機器學習）-【機器學習-Coursera Machine Learning-吳恩達】

第九周（異常發現+推薦系統）-【機器學習-Coursera Machine Learning-吳恩達】

第八週（無監督學習）-【機器學習-Coursera Machine Learning-吳恩達】

第七週（SVM）-【機器學習-Coursera Machine Learning-吳恩達】

第六週（機器學習應用建議）-【機器學習-Coursera Machine Learning-吳恩達】

第五週（反向神經網路）-【機器學習-Coursera Machine Learning-吳恩達】

【Machine :Learning】樸素貝葉斯

【Machine Learning, Coursera】機器學習Week6 偏斜資料集的處理

【Machine Learning, Coursera】機器學習Week7 核函式

【Machine Learning 】線性迴歸

【Machine Learning with Peppa】分享機器學習，數學，統計和程式設計乾貨

【Machine Learning】【Python】一、HoG + SVM 物體分類 ---- 《SVM物體分類和定位檢測》

一、HoG特徵數計算

二、說明

後記

相關推薦