目標檢測入門

阿新 • • 發佈：2018-11-27

原文連結

https://www.analyticsvidhya.com/blog/2018/06/understanding-building-object-detection-model-python/

在外網上看到一篇非常好的目標檢測入門教程，特此翻譯過來，希望能對他人有所幫助，也加深下自己的記憶。（大部分機器都翻譯的可以，如有錯誤我會改正，各位也可以google看原文）

介紹

當我們看到一張影象時，我們的大腦會立即識別其中的物體。另一方面，機器識別這些物件需要大量的時間和訓練資料。但是隨著硬體和深度學習的進步，這個計算機視覺領域變得更加簡單和直觀。

以下圖為例。該系統能夠以令人難以置信的精確度識別影象中的不同物體。

目標檢測技術在各行各業中得到了迅速的應用。
它幫助自動駕駛汽車在交通中安全行駛，在擁擠的地方發現暴力行為，幫助運動隊分析球探報告，確保製造過程中零部件的質量控制，等等。
而這些僅僅是物件檢測技術所能做的皮毛而已! 在本文中，我們將瞭解什麼是目標檢測，並研究幾種不同的方法來解決這個空間中的問題。
然後我們將深入研究用Python構建我們自己的物件檢測系統。
在本文的最後，您將擁有足夠的知識來獨自承擔不同的目標檢測挑戰! 注意:本教程假設您瞭解深度學習的基礎知識，並且以前解決過簡單的影象處理問題。
如果您還沒有，或者需要複習一下，我建議您先閱讀以下文章: https://www.analyticsvidhya.com/blog/2016/03/introduction-deep-learning-fundamentals-neural-networks/ https://www.analyticsvidhya.com/blog/2016/04/deep-learning-computer-vision-introduction-convolution-neural-networks/ https://www.analyticsvidhya.com/blog/2016/10/tutorial-optimizing-neural-networks-using-keras-with-image-recognition-case-study/ 目錄什麼是目標檢測?
我們可以使用不同的方法來解決物件檢測問題
方法1:原始的方法(分而治之)
方法2:增加分部的數量
方法3:執行結構化的劃分
方法4:變得更有效率
方法5:使用深度學習進行特徵選擇並構建端到端方法
獲取技術:如何使用ImageAI庫構建物件檢測模型什麼是目標檢測? 在我們深入構建一個最先進的模型之前，讓我們先試著理解什麼是物件檢測。
讓我們(假設)為自動駕駛汽車建立一個行人檢測系統。
假設您的汽車捕獲瞭如下所示的影象。
你如何描述這幅影象?

這幅圖基本上描繪了我們的車在一個廣場附近，幾個人在我們的車前面過馬路。
由於交通標誌看不清楚，汽車的行人檢測系統應該準確地識別出人們在哪裡行走，這樣我們就可以避開他們。那麼，汽車的系統能做些什麼來確保這種情況的發生呢?
它所能做的就是在這些人周圍建立一個包圍框，這樣系統就可以確定這些人在影象中的位置，然後相應地決定走哪條路徑，以避免任何災難。

我們做目標檢測的目的有兩個方面: 1，識別影象中出現的所有物件及其位置
2，過濾掉警示標誌解決目標檢測問題的不同方法現在我們知道了問題陳述是什麼，那麼有什麼方法(或多種方法)可以解決它呢?
在本節中，我們將研究一些可以用於檢測影象中的目標的技術。
我們將從最簡單的方法開始，並從那裡找到我們的方法。
如果您對我們將在下面看到的方法有任何建議或替代方法，請在評論部分告訴我!
方法1:初始方法(分而治之) 我們可以採取的最簡單的方法是把影象分成四個部分: 1，左上角

2，右上角

3，左下角

4，右下角

現在，下一步是將這些部分分別輸入影象分類器。
這將給我們一個輸出，這部分影象是否有行人。
如果是，在原始影象中標記那個長方形。
輸出結果大致如下:

這是一個很好的方法，首先嚐試，但我們正在尋找一個更準確和更精確的系統。它需要識別整個物件(在本例中是一個人)，因為僅定位物件的一部分可能會導致災難性的結果。

方法2:增加分部的數量

以前的系統執行得很好，但是我們還能做什麼呢?
我們可以通過成倍地增加我們輸入到系統中的分部的數量來改進它。
我們的輸出

這最終既是一種恩惠，也是一種詛咒。
當然，我們的解決方案似乎比天真的方法好一點，但它充滿了許多近似相同的邊界框。
這是一個問題，我們需要一個更有條理的方法來解決我們的問題。
方法3:執行結構化的劃分為了以更結構化的方式構建我們的物件檢測系統，我們可以遵循以下步驟: 步驟1:將影象劃分為10×10的網格像這樣的:

步驟2:定義每個部分的質心步驟

3:對於每個質心，取三個不同高度和寬高比的部分

步驟4:通過影象分類器建立的所有部分獲得預測那麼最終的輸出是什麼樣子的呢?
看看下面:

但是我們可以在這方面做得更好!
繼續閱讀，看看另一種方法將產生更好的結果。
方法4:變得更有效率我們前面看到的方法在很大程度上是可以接受的，但是我們可以構建一個比它更有效的系統。
你能告訴我怎麼做嗎?
在我的腦海裡，我可以提出一個優化方案。
如果我們考慮方法3，我們可以做兩件事使我們的模型更好。增加網格大小:因此，我們可以將網格大小從10增加到20:

在這裡，我們可以從一個錨點上取9個形狀，即3個不同高度的正方形斑塊和6個不同高度的垂直和水平矩形斑塊。
這將為我們提供不同的長寬比的補丁。

當然，這兩種方法都可以幫助我們達到更細粒度的層次。
但它將再次創造一個爆炸的所有補丁，我們必須通過我們的影象分類模型。我們所能做的是，選擇有用的補丁而不是用全部補丁。
例如，我們可以構建一箇中間分類器，它試圖預測補丁是否具有背景，或者是否可能包含一個物件。
這將大大減少我們的影象分類模型必須看到的補丁。我們可以做的另一個優化，是減少說“相同的事情”的預測。
讓我們再看一遍方法3的輸出:

正如您所看到的，這兩個邊界框預測基本上是同一個人的。
我們可以選擇其中任何一個。
所以為了做出預測，我們考慮所有“說同樣的話”的補丁，然後選擇最有可能發現一個人的補丁。到目前為止，所有這些優化都給出了相當不錯的預測。
我們幾乎很有把握了，但是你能猜出少了什麼嗎?
當然是深度學習了!
方法5:使用深度學習進行特徵選擇並構建端到端方法深度學習在目標檢測領域有著巨大的潛力。
你能推薦我們在哪裡以及如何利用它來解決我們的問題嗎?
我列出了一些方法如下: 我們可以將原始影象通過神經網路來減少尺寸，而不是從原始影象中獲取補丁
我們也可以使用神經網路來建議選擇的補丁
我們可以強化一種深度學習演算法，以給出儘可能接近原始邊界框的預測。
這將確保演算法提供更緊密和更精細的包圍框預測現在我們不需要訓練不同的神經網路來解決每一個單獨的問題，我們可以用一個深層神經網路模型來嘗試解決所有的問題。
這樣做的好處是，每個較小的神經網路元件將有助於優化同一神經網路的其他部分。
這將有助於我們共同培養整個深度模型。我們的輸出將提供到目前為止我們所看到的所有方法中最好的效能，有點類似於下面的影象。
我們將在下一節中看到如何使用Python建立它。

獲取技術:如何使用ImageAI庫構建物件檢測模型現在我們知道了什麼是目標檢測，以及解決這個問題的最佳方法，讓我們構建自己的目標檢測系統吧!
我們將使用ImageAI，這是一個python庫，它支援用於計算機視覺任務的最先進的機器學習演算法。執行一個物件檢測模型來獲得預測是相當簡單的。
我們不需要通過複雜的安裝指令碼才能開始。
我們甚至不需要GPU來生成預測!
我們將使用這個ImageAI庫來獲得我們在方法#5中看到的輸出預測。
我強烈建議您(在您自己的機器上)寫下下面的程式碼，因為這將使您能夠從本節中獲得最大限度的知識。請注意，在建立物件檢測模型之前，您需要設定您的系統。
一旦您在本地系統中安裝了Anaconda，您就可以開始執行以下步驟。使用python 3.6版本建立一個Anaconda環境。

conda create -n retinanet python=3.6 anaconda

啟用環境並安裝必要的包。

source activate retinanet
conda install tensorflow numpy scipy opencv pillow matplotlib h5py keras

然後安裝ImageAI庫。

pip install https://github.com/OlafenwaMoses/ImageAI/releases/download/2.0.1/imageai-2.0.1-py3-none-any.whl

步驟4:現在下載生成預測所需的預訓練模型。
這個模型是基於RetinaNet(一篇後續文章的主題)的。
點選連結下載-視網膜網路預訓練模型https://github.com/OlafenwaMoses/ImageAI/releases/download/1.0/resnet50_coco_best_v2.0.1.h5

步驟5:將下載的檔案複製到當前工作資料夾步驟6:從這個連結下載影象。
將影象命名為image.png 步驟7:開啟jupyter筆記本(在終端中輸入jupyter筆記本)，執行以下程式碼:

from imageai.Detection import ObjectDetection
import os

execution_path = os.getcwd()

detector = ObjectDetection()
detector.setModelTypeAsRetinaNet()
detector.setModelPath( os.path.join(execution_path , "resnet50_coco_best_v2.0.1.h5"))
detector.loadModel()
custom_objects = detector.CustomObjects(person=True, car=False)
detections = detector.detectCustomObjectsFromImage(input_image=os.path.join(execution_path , "image.png"), output_image_path=os.path.join(execution_path , "image_new.png"), custom_objects=custom_objects, minimum_percentage_probability=65)


for eachObject in detections:
   print(eachObject["name"] + " : " + eachObject["percentage_probability"] )
   print("--------------------------------")

這將建立一個名為image_new的修改後的影象檔案。
png，它包含影象的邊框框。步驟8:使用以下程式碼列印影象:

from IPython.display import Image
Image("image_new.png")

恭喜你!
您已經為行人檢測建立了自己的物件檢測模型。
這有多棒?
最後指出在本文中，我們學習了什麼是物件檢測，以及建立物件檢測模型背後的直覺。
我們還了解了如何使用ImageAI庫構建用於行人檢測的物件檢測模型。只要稍微調整一下程式碼，您就可以輕鬆地轉換模型來解決您自己的物件檢測挑戰。
如果你確實用上述方法解決了這樣的問題，特別是為社會事業，請在下面的評論中告訴我!

語義分割與目標檢測入門：若干經典工作綜述

語義分割從原理上來說，語義分割就是畫素級別的分類，傳統的方法也是直接按照這個思路來做的，效率比較低，而從FCN開始，語義分割有了相對比較專用的方法。 0. 重要的資料集：PASCAL VOC和COCO 1. FCN 用於影象（N×M）分類的網路前端用卷積層提取特徵，後端用全連線層進

目標檢測入門

原文連結 https://www.analyticsvidhya.com/blog/2018/06/understanding-building-object-detection-model-python/ 在外網上看到一篇非常好的目標檢測入門教程，特此翻譯過來，希望能對他人有所幫助，也加深下

目標檢測入門之（三）RCNN系列：RCNN->SppNET->Fast-RCNN->Faster-RCNN

object detection，就是在給定的圖片中精確找到物體所在位置，並標註出物體的類別。object detection要解決的問題就是物體在哪裡，是什麼這整個流程的問題。然而，這個問題可不是那麼容易解決的，物體的尺寸變化範圍很大，擺放物體的角度，姿態不定，而且可以

目標檢測入門：tensorflow實現faster rcnn——TFFRCNN

1.需要下載的資料、程式碼、檔案：資料：Pascal voc2007資料集 2.訓練和測試直接使用論文訓練好的模型進行測試：demo.py(在faster_rcnn資料夾下) 進入lib資料夾下進行make cd ./lib make 在根目錄下新建

乾貨 | 目標檢測入門，看這篇就夠了（上）

作者 | 李家丞（同濟大學數學系本科在讀，現格靈深瞳演算法部實習生）近年來，深度學習模型逐漸取

目標檢測入門論文YOLOV1精讀以及pytorch原始碼復現(yolov1)

## 結果展示 > 其中綠線是我繪製的影象劃分網格。 > > 這裡的loss是我訓練的 0.77 ，由於損失函式是我自己寫的，所以可能跟大家的不太一樣，這個不重要，重要的是學習思路。 ![](https://i.loli.net/2021/03/14/jDaYKel3G51zviX.png) ![]

從R-CNN到RFBNet,深度目標檢測5年縱覽，文章+程式碼讓你從入門到精通(轉)

mark一下，最早是從機器學習研究會上看到，收藏之後一直沒時間細讀。現開始閱讀並分享出來。最後感謝作者分享！文章名 | Deep Learning for Generic Object Detection: A Survey 文章地址 | https://arxiv.org/abs/1

動態視訊目標檢測和跟蹤技術(入門)

動態視訊目標檢測和跟蹤技術 http://m.qingqingsk.com/ztnews/lvvozlzrztkzrqwqqlnrluqk.html 傳統電視監控技術只能達到“千里眼”的作用，把遠端的目標影象（原始資料）傳送到監控中心，由監控人員根據目視到的視訊影象對

tensorflow入門教程(二十五)Object Detection API目標檢測(下)

1、概述上一講，我們使用了別人根據COCO資料集訓練好的模型來做目標檢測，這一講，我們就來訓練自己的模型。 2、下載資料集為了方便學習，我們先使用別人整理好的資料集來訓練---VOC 2012資料集。VOC 2012一共有17125張圖片，每張圖片都有標註，標註的內

yolo_v2入門實現目標檢測

python開發環境，安裝了tensorflow-gpu和keras和其他常用機器學習庫。該過程使用yolo_v2進行測試。獲取YAD2K原始碼 yolo有專有的深度學習網路darknet，Y

使用Caffe完成圖像目標檢測和 caffe 全卷積網絡

-h alt avi 5.0 type multi 序號 forward lin 一、【用Python學習Caffe】2. 使用Caffe完成圖像目標檢測標簽： pythoncaffe深度學習目標檢測ssd 2017-06-22 22:08 207人閱讀評論(0)

我收集的一些目標檢測、跟蹤、識別標準測試視頻集和圖像數據庫

ima detail track 分離 urb images data mic hang 一個網友收集的運動目標檢測，陰影檢測的標準測試視頻 http://blog.csdn.net/sunbaigui/article/details/6363390 很權威的c

目標檢測框架py-faster-rcnn修改anchor_box

算法框架 ams const fas nbsp 這一 res weight 眾所周知，anchor_box控制了回歸框的大小，我們有時候檢測的是大物體或小物體時，需要調整回歸框的大小的時候，得改一下anchor_box。基於rgb公開的py-faster-rcnn修改an

無人超市目標檢測算法的選型

目標檢測深度學習經過測試得出以下結論：1、傳統的目標檢測算法主要有以下幾種：（1）基於Boosting框架：Haar/LBP/積分HOG/ACF feature+Adaboost （2）基於SVM：HOG+SVM or DPM等（3）模版匹配（特殊情況下可以用到）人工特征和LBP，HAAR

貨品目標檢測樣本制作方法

voc 樣本制作目標檢測最近公司要做無人超市項目，基本實現方式是通過攝像頭檢測貨櫃裏面有多少個什麽類別的貨品，也就是目標檢測算法。該方法所需數據樣本為標記了位置的貨品圖片，如下所示。為了制作該圖片，設計方法如下：1、拍攝該樣品360度的視頻2、將視頻抓幀3、將圖片通過opencv拼裝成樣本拍

目標檢測網絡之 YOLOv2

ota rcnn 背景 log 除了 .org module BE 保存 YOLOv1基本思想 YOLO將輸入圖像分成SxS個格子，若某個物體 Ground truth 的中心位置的坐標落入到某個格子，那麽這個格子就負責檢測出這個物體。每個格子預測B個bounding

吳恩達【深度學習工程師】 04.卷積神經網絡第三周目標檢測（1）基本的對象檢測算法

元素需要有關卷積訓練特定步長來看選擇該筆記介紹的是《卷積神經網絡》系列第三周：目標檢測（1）基本的對象檢測算法主要內容有： 1.目標定位 2.特征點檢測 3.目標檢測目標定位使用算法判斷圖片中是不是目標物體，如果是還要再圖片中標出其位置並

語義分割(semantic segmentation) 常用神經網絡介紹對比-FCN SegNet U-net DeconvNet，語義分割,簡單來說就是給定一張圖片,對圖片中的每一個像素點進行分類；目標檢測只有兩類,目標和非目標，就是在一張圖片中找到並用box標註出所有的目標.

avi projects div 般的 ict 中間接受 img dense from：https://blog.csdn.net/u012931582/article/details/70314859 2017年04月21日 14:54:10 閱讀數：4369

目標檢測 — two-stage檢測

利用 one 表示 pos 但是 tun search方法還需抽取　　目前主流的目標檢測算法主要是基於深度學習模型，其可以分成兩大類：two-stage檢測算法；one-stage檢測算法。本文主要介紹第一類檢測算法，第二類在下一篇博文中介紹。　　目標檢測模型的主要

目標檢測 — one-stage檢測（二）

vol 最大由於直接 nta -c loss 機制階段　　one-stage檢測算法，其不需要region proposal階段，直接產生物體的類別概率和位置坐標值，經過單次檢測即可直接得到最終的檢測結果，因此有著更快的檢測速度，比較典型的算法如YOLO，SSD

目標檢測入門

方法2:增加分部的數量

相關推薦