1. 程式人生 > >學習計算機視覺:(三)深度學習在計算機視覺中的應用

學習計算機視覺:(三)深度學習在計算機視覺中的應用

1.影象分類:卷積神經網路CNN

  1. 影象分類概念
    首先,影象分類是解決是什麼的問題?
    如下圖,給定一幅圖片,網路能夠給出“最像”什麼的概率:
    這裡寫圖片描述

  2. 影象分類使用的技術

    •卷積神經網路CNN
    它是計算機視覺中的基礎網路,有監督深度模型時代的起點
    AlexNet,VGG,GoogLeNet,ResNet,ResNeXt
    • GoogLeNet
    Inception V1 -> V2 -> V3 -> V4
    Inception ResNet V1 -> V2
    • 結構趨勢
    更深(Depth):8層 -> 1000+層
    更寬(Width):1分支 -> 4+分支
    更多基數(Cardinality ):1 -> 32

2.影象檢測:區域卷積神經網路R-CNN

  1. 影象(目標)檢測的概念
    首先,什麼是目標檢測?
    這裡寫圖片描述

  2. 影象檢測使用的技術
    •區域卷積神經網路R-CNN
    讓基礎網路具備區域輸出能力
    第1階段:R-CNN -> SPP-Net -> Fast/Faster R-CNN
    第2階段:YOLO -> SSD -> R-FCN
    •目的
    檢測更快、更準確
    • 工業應用
    智慧監控
    輔助駕駛

3.影象分割:全卷積神經網路FCN

  1. 影象分割的概念
    首先,什麼是影象分割?
    這裡寫圖片描述
  2. 影象分割使用的技術
    • 全卷積神經網路FCN
    讓基礎網路做畫素輸出

    FCN -> SegNet/DeconvNet -> DeepLab
    • 目的
    語義推斷
    分割更精確
    • 工業應用
    輔助駕駛

4.影象描述&影象問答:迭代神經網路RNN

  1. 影象描述&影象問答的概念
    首先什麼是影象描述&影象問答?
    這裡寫圖片描述
    • 視覺&語言
    圖片描述 (Captioning)
    圖片問答(Question Answering)
    • Caption(圖片生成說明)
    一個人在用自動駕駛系統開車
    • QA(圖片生成問答)
    Q:這個人為什麼雙手離開了方向盤
    A:因為他啟動了無人駕駛功能

  2. 影象描述&影象問答所用到的技術
    •遞迴神經網路RNN
    具有記憶功能,構建不定長序列資料的模型
    Vanilla RNN -> LSTM -> GRU
    • 應用範圍
    文字序列
    區域序列
    視訊序列
    • 研究問題
    圖片描述、問答

5.影象生成:生成對抗網路GAN

  1. 影象生成的概念
    首先,什麼是影象生成?
    這裡寫圖片描述
  2. 影象生成所用到的技術
    • 生成對抗網路GAN
    • 網路結構
    生成器網路( Generator )
    判別器網路( Discriminator )
    • 網路路線
    無監督:GAN -> DCGAN -> wGAN
    有監督:SRGAN、SalGAN 、RLA
    • 應用範圍:
    樣本資料分佈(生成)學習
    半監督問題的資料增強
    有監督問題的優化(Dynamic loss)

相關推薦

學習計算機視覺深度學習計算機視覺應用

1.影象分類:卷積神經網路CNN 影象分類概念 首先,影象分類是解決是什麼的問題? 如下圖,給定一幅圖片,網路能夠給出“最像”什麼的概率: 影象分類使用的技術 •卷積神經網路CNN 它是

機器學習 深度學習的經典論文、程式碼、部落格文章

前言     總結了Deep Learning應用相關的經典論文、程式碼、部落格文章之類,包括CNN、RCNN、DQN、RNN等,github上看到。 原文地址:https://github.com/kristjankorjus/applied-deep-l

深度學習與自然語言處理——深度學習運用到自然語言處理領域的成功案例

目錄 1.全連線前饋神經網路(MLP)的應用 大部分情況下,全連線前饋神經網路(MLP)能被用來替代線性學習器。這包括二分類或多分類問題,以及更復雜的結構化預測問題。網路的非線性以及易於整合預訓練詞嵌入的能力經常帶來更高的分類精度。一系列工作通過簡單地將句

李巨集毅機器學習PTT的理解1深度學習的介紹

深度學習的介紹 機器學習就像是尋找一個合適的函式,我們輸入資料就可以得到想要的結果,比如: 在語音識別中,我們輸入一段語音,函式的輸出值就是識別的結果;在影象識別中,輸入一張照片,函式可以告訴我們分類

深度學習與TensorFlow實戰深度學習基本概述

傳統的機器學習演算法例如SVM、Boosting、最大熵、LR都屬於淺層的機器學習模型,這些模型只有一層隱藏節點,或者沒有隱藏節點(LR),其侷限在於有限樣本和計算單單元對複雜函式的表示能力有限,泛化能力的侷限性也較大。深度學習可以通過學習深層非線性網路結構,實

深度學習TensorFlow環境搭建Ubuntu16.04+CUDA8.0+cuDNN7+Anaconda4.4+Python3.6+TensorFlow1.3

缺失 應該 否則 wid -c 方式 *** 也不能 collected   緊接著上一篇的文章《深度學習(TensorFlow)環境搭建:(二)Ubuntu16.04+1080Ti顯卡驅動》,這篇文章,主要講解如何安裝CUDA+CUDNN,不過前提是我們是已經把NVID

深度學習論文翻譯解析Detecting Text in Natural Image with Connectionist Text Proposal Network

論文標題:Detecting Text in Natural Image with Connectionist Text Proposal Network 論文作者:Zhi Tian , Weilin Huang, Tong He , Pan He , and Yu Qiao 論文原始碼的下載地址:htt

《好好學習》讀書筆記第二章掌握臨界知識的方法

目錄 心態準備 1.新舊知識建立聯絡 2.發掘新知識的通用性 3.花慢功夫死磕關鍵知識,打通知識網的要塞,融匯貫通 具體方法 1.反思 2.以教為學           3.

《機器學習實戰》筆記樸素貝葉斯

4.1 基於貝葉斯決策理論的分類方法 樸素貝葉斯是貝葉斯決策理論的一部分,貝葉斯決策理論的的核心思想,即選擇具有最高概率的決策。若p1(x,y)和p2(x,y)分別代表資料點(x,y)屬於類別1,2的概率,則判斷新資料點(x,y)屬於哪一類別的規則是: 4.3 使用條件概率來分類

零基礎學習OpenGL--深度測試

       深度緩衝:在每個片段中儲存了資訊,以16、24、32位float的形式儲存它的深度值。(片段著色器執行之後,在螢幕空間中執行。)        當深度測試啟用,OpenGL會將一個片段的深度值和深度緩衝

深度學習入門筆記系列——感知器模型和 tensorboard 的使用方法

本系列將分為 8 篇 。今天是第三篇 。主要講講感知器模型和 tensorboard 的基本使用方法 。 1. 感知器模型 因為小詹之前寫過一篇感知器模型的介紹 ,這裡就不贅述了 。有需要鞏固的點選如下連結跳轉即可 : 2. tensorboard Tenso

深度學習】線性迴歸使用MXNet深度學習框架實現線性迴歸

文章目錄 概述 程式碼 概述 這篇文章使用MXNet深度學習框架中的Gluon包實現小批量隨機梯度下降的線性迴歸問題。可以參考我的上一篇文章【深度學習】線性迴歸(二)小批量隨機梯度下降及其python實現。 主要包

《好好學習》閱讀筆記第二章掌握臨界知識的方法

目錄 心態準備 具體方法 1.反思 心態準備 1.新舊知識建立聯絡 連線成網,從不同角度和領域對同一個知識進行分析,加深理解 [----知識結構 章魚狀 -》蜂窩狀] [----思維導圖試記憶-》殿堂式記憶(like sherlock)]

「Medical Image Analysis」Note on 3D Deep Learning 深度學習

[1] 3D Deep Learning for Efficient and Robust Landmark Detection in Volumetric Data MICCAI 2015 [pap

機器學習深度學習系列連載 第二部分 深度學習深度學習技巧4Deep learning tips- Dropout

深度學習技巧4( Dropout) Dropout 在2012年imagenet 比賽中大放異彩,是當時CNN模型奪冠的功勳環節之一。 那什麼是Dropout 我們先直觀的理解: 練武功的時候,訓練的時候腳上綁上重物 等到練成下山的時候: 我們從幾個方面來解

Libcap庫學習抓包流程

理解了Libpcap的工作原理,下面將介紹如何利用Libpcap庫進行資料包的捕獲。其具體的程式設計流程如下: (1)網路裝置查詢 網路裝置查詢的目的就是發現可用的網絡卡,它的實現函式是pcap_lookupdev(),如果當前有多個網絡卡,它會返回一個網路裝置名指標列表。 (2)開

機器學習系列特徵提取與處理

第一個SURF描述符: [ 1.15299134e+02 2.56185453e+02 3.51230841e+00 3.32786485e+02 1.00000000e+00 1.75644866e+00 -2.94268692e-03 3.30736379e-03 2

學習之路-RabbitMQSpringBoot整合RabbitMQ

一:引入RabbitMQ的相關jar包: <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-amqp

學習之路-RabbitMQRabbitMQ的工作模式

RabbitMQ有以下幾種工作模式 : 1、Work queues 工作佇列 2、Publish/Subscribe 釋出訂閱模式 3、Routing 路由模式 4、Topics 萬用字元模式 5、Header 6、RPC 一:Work queues 工作佇列 work queues與

學習之路-RabbitMQRabbitMQ的入門程式

1.建立maven工程 2.分別在兩個工程中匯入依賴 <dependency> <groupId>com.rabbitmq</groupId> <artifactId>amqp‐client</artifactId>