用DPM(Deformable Part Model，voc-release3.1)演算法在INRIA資料集上訓練自己的人體檢測模型

阿新 • • 發佈：2019-01-10

我的環境

DPM原始碼版本：voc-release3.1

VOC開發包版本：VOC2007_devkit_08-Jun

Matlab版本：MatlabR2012b

c++編譯器：VS2010

系統：Win7 32位

learn.exe迭代次數：5萬次

資料集：INRIA 人體資料集，等

步驟一，首先要使voc-release3.1目標檢測部分的程式碼在windows系統下跑起來：

上文中用的4.01，3.1需要修改的地方是一樣的，反而更簡單。

步驟二，把訓練部分程式碼跑通，在VOC資料集上進行測試，如下文：

步驟三，再之後就是使之能在其他的資料集上訓練模型，比如INRIA人體資料集。

這一步中主要是修改pascal_data.m檔案，這個檔案的作用就是讀取標註，為訓練準備資料。此函式會返回兩個陣列，pos[]和neg[]，

pos[]中是正樣本資訊，格式為：[imagePath x1 y1 x2 y2 ]；

neg[]中是負樣本資訊，格式為：[imagePath] 。

先讀取INRIA資料集的標註，儲存為下面的格式：

然後在pascal_data.m中讀取此檔案，依次將標註資訊儲存到pos[]陣列中，注意要將圖片路徑補全為絕對路徑。

    pos = []; % 儲存正樣本目標資訊的陣列，每個元素是一個結構，{im, x1, y1, x2, y2}
    numpos = 0; % 正樣本目標個數(一個圖片中可能含有多個正樣本目標)
    
    % InriaPersonPos.txt是從Inria人體資料集獲得的50個正樣本的標註檔案，格式為[x1 y1 x2 y2 RelativePath]
    [a,b,c,d,p] = textread('InriaPersonPos.txt','%d %d %d %d %s'); % 注意：讀取後p的型別時50*1的cell型別
    
    % 遍歷訓練圖片檔名陣列ids
    for i = 1:length(a);
        if mod(i,10)==0
            fprintf('%s: parsing positives: %d/%d\n', cls, i, length(a));
        end;
        numpos = numpos+1; % 正樣本目標個數
        pos(numpos).im = [VOCopts.datadir p{numpos}]; % 引用cell單元時要用{},引用矩陣單元時用()
        pos(numpos).x1 = a(numpos);
        pos(numpos).y1 = b(numpos);
        pos(numpos).x2 = c(numpos);
        pos(numpos).y2 = d(numpos);
    end

pos(numpos).im 中我也在相對路徑前加了VOCopts的資料集目錄datadir是因為我將INRIA資料集放在VOCdevkit目錄下了。

這裡要特別注意的是，不需要提前從INRIA資料集中根據標註檔案手動裁出人體目標，而是將標註資訊和正樣本原圖都告訴DPM演算法，它自動會進行縮放、剪裁處理，對於有的標註資訊超過影象邊界的，也沒關係，DPM中也會自己處理。

至於負樣本就無所謂了，反正都是從不含人體的原圖上隨機裁取，還用VOC資料集中的就行。

下面展示幾個訓練的模型，以及檢測結果

（1）50個INRIA正樣本目標，300個VOC負樣本目標，單元件(component)模型，部件個數為6。

模型視覺化圖如下：

沒想到僅用50個正樣本，訓練出的模型竟然很不錯，這也跟INRIA人體資料集的質量很高有關。

檢測結果如下：

在500個VOC測試圖上獲得的平均精度AP=0.091

（2）537個Spinello RGBD資料集中的正樣本目標，300個VOC負樣本目標，單元件，6個部件。

模型視覺化如下：

由於這537個正樣本目標來自對單個人的跟蹤結果，所以樣本不太好，如下：

所以訓練出來的模型根本檢測不到任何人體目標。

（3）2396個Spinello RGBD資料集中的正樣本目標，300個VOC負樣本目標，單元件，6個部件。

模型視覺化如下：

這次的資料來源和（2）中相同，只不過這次正樣本取自資料集中的所有34個人的跟蹤結果，訓練了一個晚上，結果還行。

檢測結果如下：

在500個VOC測試圖上獲得的平均精度AP=0.091。帶包圍盒預測的精度-召回率(precision-recall)曲線如下：

參考

用DPM(Deformable Part Model，voc-release3.1)演算法在INRIA資料集上訓練自己的人體檢測模型

我的環境 DPM原始碼版本：voc-release3.1 VOC開發包版本：VOC2007_devkit_08-Jun Matlab版本：MatlabR2012b c++編譯器：VS2010 系統：Win7 32位 learn.exe迭代次數：5萬次資料集

Ubuntu 16.04下利用tf-faster-rcnn在VOC或其他資料集上訓練自己的模型

暑期的時候有朋友問我如何配置tf-faster-rcnn，那會簡單寫了個steps.pdf。正好最近閒了下來，就把它彙總一下。 Introduction 這是一篇介紹如何使用tf-faster-rcnn在VOC和其他資料集訓練自己模型的筆記. 筆記中所有檔案的地

關於DPM(Deformable Part Model)演算法中模型結構的解釋

含有n個部件的目標模型可以形式上定義為一個(n+2)元組：(F0,P1,..., Pn, b)，F0是根濾波器，Pi是第i個部件的模型，b是表示偏差的實數值。每個部件模型用一個三元組定義：(Fi,vi, di)，Fi是第i個部件的濾波器；vi是一個二維向量，指定第i個

基於keras的YOLOv3在VOC資料集上訓練測試

一、編譯環境 windows7 Anaconda+python3.6+keras+tensroflow+pyCharm 二、步驟測試從上文第二個github上下載工程，並用

用Deformable Part Model(DPM)voc-release3.1訓練自己的模型

配置了一上午，終於能訓練自己的DPM模型，實屬不易我的環境 DPM原始碼版本：voc-release3.1 VOC開發包版本：VOC2007_devkit_08-Jun 使用的訓練資料集：VOC2007

DPM（Deformable Part Model）原理詳解（匯總）

特征向量成就算法思想 filter people tell 梯度錨點精度寫在前面： DPM（Deformable Part Model），正如其名稱所述，可變形的組件模型，是一種基於組件的檢測算法，其所見即其意。該模型由大神Felzenszwalb在2008年提

DPM(Deformable Parts Model)--原理(一)

數據 code har 生命聚類 spec ans 每一個 f11 http://blog.csdn.net/ttransposition/article/details/12966521 DPM(Deformable Parts Model) Reference: Ob

在Windows下執行Felzenszwalb的star-cascade DPM(Deformable Part Models)目標檢測Matlab原始碼

可變形部件模型Deformable Part Models(DPM)是非常經典的目標檢測演算法，由Felzenszwalb提出，本文介紹如何在windows下執行Felzenszwalb給出的DPM演算法的star-cascade版本voc-relea

(1) 在window下執行DPM(deformable part models) -（檢測demo部分）

可以從http://www.cs.berkeley.edu/~rbg/latent/index.html獲得的原始碼，採用Matlab和C++編寫，我下載的是voc-release4.01版本，大概是因為版權的問題原始碼是在 Linux and Mac OS上執行的，考慮

有關可變形部件模型(Deformable Part Model)的一些說明

（1）可變形部件模型可變形部件模型(DeformablePart Model)由三部分組成： (1) 一個較為粗糙的，覆蓋整個目標的全域性根模版(或叫做根濾波器)。 (2) 幾個高解析度的部件模版(或叫做部件濾波器)。

Matlab之Kalman：用線性系統狀態方程，通過系統輸入輸出觀測資料，對系統狀態進行最優估計的演算法

卡爾曼濾波（Kalman filtering）一種利用線性系統狀態方程，通過系統輸入輸出觀測資料，對系統狀態進行最優估計的演算法。由於觀測資料中包括系統中的噪聲和干擾的影響，所以最優估計也

有1000桶酒，其中1桶有毒。而一旦吃了，毒性會在1周後發作。現在我們用小老鼠做實驗，要在1周後找出那桶毒酒，問最少需要多少老鼠

10只老鼠按順序排好，每桶酒按照編號轉換成二進位制，給相應位置上是1的老鼠喝。最後按死掉的老鼠是哪幾只，然後排成二進位制，再轉成十進位制就是第幾桶酒。比如：第70桶酒，70轉換成二進位制就是0001000110，那麼

用java寫一個函式，實現Fibonacci數列演算法(1,1,2,3,5,8,13......)

這個演算法就是第一個數的救國是前兩個數相加, 這個還是結合例子比較好想 public class dd1 { public void getFibonacci(int number){ int nLeft = 0; int nRight = 1; System.out.pr

用自己的資料，製作python版本的cifar10資料集

前期準備：3通道圖片60000張，如果你沒有那麼大的資料量，需要改變cifar-10-API中的定義，下面會具體說到。如果你的圖片是灰度圖（單通道）可以用這種方法來改為三通道： opencv將灰度圖轉化為RGB三通道影象要求為python2.7版本，

CelebA資料集簡單介紹，及做人臉識別時資料集的處理

CeleA是香港中文大學的開放資料，包含10177個名人身份的202599張圖片，並且都做好了特徵標記，這對人臉相關的訓練是非常好用的資料集。網盤連結資料包含了三個資料夾，一個描述文件如下： img資料夾下有兩個壓縮包 img_align_celeba.zip & img_al

拒絕調包俠，不需要高階演算法和資料結構技巧

前言大多數工科學生或者剛剛入門近年來比較火的“人工智慧”相關演算法的同學，在選擇語言的時候，都會選擇MATLAB、Python、R等等這些高階語言，對自己所學的演算法進行實現和除錯。這些高階語言中，包含了實現複雜演算法的基礎數學演算法、基本統計演算法、基礎資料結構的實現，比如均值（mean）、方差（std

Python爬蟲爬取網上圖片原始碼，可用來製作深度學習資料集

這次利用python設計一個爬取百度圖片上的圖片的原始碼，其中利用的是python的urllib，如果沒有裝的，可以使用Anconda在環境裡進行安裝或者 pip install urllib 這兩種方式都可以安裝，長話短說，上圖吧，點選執行後，輸入你要下載的圖片型別：比如，熊貓？美女？

ICnet基於VOC資料集的訓練

Voc4ICnet 資料集準備的目的:ICNET基於VOc資料集的訓練,和同時做分割和檢測的Blitznet做對比. 一、資料集標籤製作與準備: Pascal VOC資料集可用於目標檢測和分割,提供了語義分割標籤和例項分割標籤. 本文中使用的資料集為原始的pas

人臉識別，解析MS-Celeb-1M人臉資料集及FaceImageCroppedWithAlignment.tsv檔案提取【人臉識別】解析MS-Celeb-1M人臉資料集及FaceImageCroppedWithAlignment.tsv檔案提取

原【人臉識別】解析MS-Celeb-1M人臉資料集及FaceImageCroppedWithAlignment.tsv檔案提取 2018年09月19日 13:11:54

Spark中元件Mllib的學習11之使用ALS對movieLens中一百萬條（1M）資料集進行訓練，並對輸入的新使用者資料進行電影推薦

1解釋 spark-1.5.2 資料集：http://grouplens.org/datasets/movielens/ 一百萬條（1M）資料劃分：將樣本評分表以key值切分成3個部分，分別用於訓練 (60%，並加入使用者評分), 校驗 (20

用DPM(Deformable Part Model，voc-release3.1)演算法在INRIA資料集上訓練自己的人體檢測模型

相關推薦