卷積神經網路（4）----目標檢測

阿新 • • 發佈：2018-11-25

一、分類、定位和檢測

簡單來說，分類、定位和檢測的區別如下：

分類：是什麼？
定位：在哪裡？是什麼？（單個目標）
檢測：在哪裡？分別是什麼？（多個目標）


(1)目標分類	(2)目標定位	(3)目標檢測

二、目標定位：

1）案例1：在構建自動駕駛時，需要定位出照片中的行人、汽車、摩托車和背景，即四個類別。

輸出：

1，2，3為要檢測的行人、汽車、摩托車， Pc=1

4為背景， Pc

Pc：首先第一個元素p_c=1表示有要定位的物體的概率，即是有1，2，3類的概率，否則p_c=0表示只有背景第4類如上圖的第二個圖。

bx，by,bh，bw：這四個輸出元素表示定位框的中心座標bx，by和寬高bh，bw

c1,c2,c3：3個輸出元素one-hot表示是三個類別（1，2，3）中的哪一類。

當第一個元素p_c=0時表示是背景，然後就不需要考慮其他輸出了

損失函式：

輸出向量中有8個元素：故：

if y1 =1 ，L = （y'₁-y₁)² + (y'₂-y₂)² + ……+（y'₈-y₈)²

if y1 = 0，L = （y'₁-y₁)²

實際使用中p_c使用邏輯迴歸，c₁

,c₂,c₃是用softmax啟用然後用對數損失函式，位置資訊是使用平方誤差損失函式，然後將這些損失函式相加起來得到最終的代價函式。當標籤y=0時，只考慮p_c即可。

三、特徵點檢測：

特徵點檢測就是第一個單元輸出1，表示有這個物件（如人臉），

然後如果在人臉上定義了64個特徵點（如下圖所示），每個特徵點用（x,y）表示，那麼網路將會有1+2*68=129個單元輸出。

需要注意的一點是在標註樣本時，所有標籤在所有圖片中務必保持一致，比如說，第5個特徵點表示左眼的外眼角，那麼所有圖片的第五個特徵點都應該是這個。

四、目標檢測：滑動視窗、YOLO演算法【更好解決邊界】

https://www.cnblogs.com/ys99/p/9326637.html

傳統的視窗滑動：將圖片切割成很多小視窗，然後進行目標檢測。直到某個小視窗檢測到目標。

卷積的滑動視窗實現：在原輸入補上邊，在進行卷積操作，得到結果。

例如：

原輸入是14*14*3，輸出是1*1*4【4個分類】。傳統的滑動視窗是將原輸入切成4個，每個大小為12*12*3。經過重複4次卷積操作得到4個1*1*4。

卷積的滑動視窗：將原輸入補成16*16*3，輸出為2*2*4。只需要經過一次卷積操作就可以得到和4個1*1*4相同的結果2*2*4=2*2*（1*1*4）。

交併比函式是用來判斷物件定位是否準確，IoU=（A∩B）/（A∪B），一般將交併比的值大於0.5看成是檢測正確的，當然這個值可以根據實際情況來定。

卷積神經網路（4）----目標檢測

一、分類、定位和檢測簡單來說，分類、定位和檢測的區別如下：分類：是什麼？定位：在哪裡？是什麼？（單個目標）檢測：在哪裡？分別是什麼？（多個目標） (1)目標分

卷積神經網路（3）:目標檢測學習筆記[吳恩達Deep Learning]

1.目標定位 1.1 分類、定位、檢測簡介 - Image classification 影象分類，就是給你一張圖片，你判斷目標是屬於哪一類，如汽車、貓等等。 - Classification with localization 定位分類，

卷積神經網絡（4）----目標檢測

使用定義 fmt 應該否則 vdh lan blog 檢測一、分類、定位和檢測簡單來說，分類、定位和檢測的區別如下：分類：是什麽？定位：在哪裏？是什麽？（單個目標）檢測：在哪裏？分別是什麽？（多個目標） (1)目標分類

TensorFlow實戰：Chapter-6（CNN-4-經典卷積神經網路（ResNet）)

ResNet ResNet簡介 ResNet(Residual Neural Network)由微軟研究院的何凱明大神等4人提出，ResNet通過使用Residual Unit成功訓練152層神經網路，在ILSCRC2015年比賽中獲得3.75%的

基於卷積神經網路（CNN）的目標檢測部分資源

一、程式碼資源 SSD演算法[1]（2015年），該演算法基於caffe，網址： https://github.com/weiliu89/caffe/tree/ssdFaster R-CNN（2015年），該演算法基於caffe， MATLAB版本網址

卷積神經網路（CNN）在語音識別中的應用

卷積神經網路（CNN）在語音識別中的應用作者：侯藝馨前言總結目前語音識別的發展現狀，dnn、rnn/lstm和cnn算是語音識別中幾個比較主流的方向。2012年，微軟鄧力和俞棟老師將前饋神經網路FFDNN（Feed Forward Deep Neural Network）引入到聲學模

卷積神經網路（CNN）_相關知識

斯坦福公開課 CS231n Convolutional Neural Networks for Visual Recognition ： http://cs231n.stanford.edu/syllabus.html 網路引數初始化：https://www.cnblogs.com/yinheyi

卷積神經網路（CNN）一之概念原理

　　什麼是卷積神經網路呢？這個的確是比較難搞懂的概念，特別是一聽到神經網路，大家腦海中第一個就會想到複雜的生物學，讓人不寒而慄，那麼複雜啊．卷積神經網路是做什麼用的呢？它到底是一個什麼東東呢？卷積神經網路的靈感源一種生物程序，其中神經元之間的聯結模式和動物視覺皮層組織非常相似。所以發明者把它叫做卷積神經網

機器學習之卷積神經網路（九）

摘要：　　卷積神經網路（Convolutional Neural Network,CNN）是一種前饋神經網路，它的人工神經元可以響應一部分覆蓋範圍內的周圍單元，對於大型影象處理有出色表現。引言：　　在傳統的機器學習中，通常是我們自己來尋找特徵，而深度學習中我們通過神經網路來自主的學習特診。在大量資

【6年人工智慧開發】簡述卷積神經網路（CNN）

在百度做了6年人工智慧方面的程式設計開發，也有很多這方面的經驗吧，從古至今，機器人一直承載著人類巨大的夢想。隨著各類感測器、語音互動、機器識別、SLAM等技術的蓬勃發展，機器人開始從科幻作品中走出

搭建簡單圖片分類的卷積神經網路（三）-- 模型的測試和運用

兩個功能都在同一個檔案中一、新建Disimage.py檔案 import tensorflow as tf from PIL import Image import os import numpy as np import matplotlib.pyplot as plt from Get

搭建簡單圖片分類的卷積神經網路（二）-- CNN模型與訓練

一、首先，簡單來說CNN卷積神經網路與BP神經網路主要區別在於： 1、網路的層數的多少（我這裡的CNN是比較簡單的，層數較少，真正應用的話，層數是很多的）。 2、CNN名稱來說，具有卷積運算的特點，對於大型的圖片或者數量多的圖片，卷積運算可以大量提高計算效能，而BP神經網路大都為全連線層，計

搭建簡單圖片分類的卷積神經網路（一）-- 訓練模型的圖片資料預處理

一、訓練之前資料的預處理主要包括兩個方面 1、將圖片資料統一格式，以標籤來命名並存到train資料夾中（假設原始圖片按類別存到資料夾中）。 2、對命名好的圖片進行訓練集和測試集的劃分以及圖片資料化。先對整個專案檔案進行說明：專案資料夾

用於說明卷積神經網路（ConvNet）的Python指令碼

借鑑：https://github.com/gwding/draw_convnet 直接上程式碼： import os import numpy as np import matplotlib.pyplot as plt plt.rcdefaults() from matplotlib.li

卷積神經網路（CNN）基礎

CNN的基本結構原文地址：https://www.jianshu.com/p/da0c4cc76a06 CNN分為幾層 CNN一共有卷積層（CONV）、ReLU層（ReLU）、池化層（Pooling）、全連線層（FC（Full Connection））下面是各個層的

吳恩達深度學習筆記（deeplearning.ai）之卷積神經網路（CNN）（上）

1. Padding 在卷積操作中，過濾器（又稱核）的大小通常為奇數，如3x3，5x5。這樣的好處有兩點：在特徵圖（二維卷積）中就會存在一箇中心畫素點。有一箇中心畫素點會十分方便，便於指出過濾器的位置。在沒有padding的情況下，經過卷積操作，輸出的資

卷積神經網路（CNN）之一維卷積、二維卷積、三維卷積詳解

由於計算機視覺的大紅大紫，二維卷積的用處範圍最廣。因此本文首先介紹二維卷積，之後再介紹一維卷積與三維卷積的具體流程，並描述其各自的具體應用。 1. 二維卷積圖中的輸入的資料維度為14×1414×14，過濾器大小為5×55×5，二者做卷積，輸出的資料維度為10×1

深入學習卷積神經網路（CNN）的原理知識

　　網上關於卷積神經網路的相關知識以及數不勝數，所以本文在學習了前人的部落格和知乎，在別人部落格的基礎上整理的知識點，便於自己理解，以後複習也可以常看看，但是如果侵犯到哪位大神的權利，請聯絡小編，謝謝。好了下面言歸正傳：　　在深度學習領域中，已經經過驗證的成熟演算法，目前主要有深度卷積網路（DNN）和遞迴網

簡單介紹卷積神經網路（CNN）

前言：原創： Python開發者內容取自公眾號——Python開發者，有興趣的可以關注一下什麼是卷積神經網路，它為何重要？卷積神經網路（也稱作 ConvNets 或 CNN）是神經網路的一種，它在影象識別和分類等領域已被證明非常有效。卷積神經網路除了為機器人

吳恩達深度學習系列課程筆記：卷積神經網路（一）

本系列文章將對吳恩達在網易公開課“深度學習工程師”微專業內容進行筆記總結，這一部分介紹的是“卷積神經網路”部分。 1、計算機視覺計算機視覺在我們還是生活中有非常廣泛的應用，以下幾個是最常見的例子：影象分類：可以對影象中的物體種類進行判斷，如確定影象中

卷積神經網路（4）----目標檢測

一、分類、定位和檢測

二、目標定位：

輸出：

損失函式：

三、特徵點檢測：

四、目標檢測：滑動視窗、YOLO演算法【更好解決邊界】

相關推薦