CAM論文剖析（Learning Deep Features for Discriminative Localization）

阿新 • • 發佈：2019-01-13

英文原文請點這裡
譯文請點這裡
Agenda

文章內容剖析

實驗程式碼在這裡.
文章剖析

摘要

本文主要工作

1、闡述GAP如何使CNN具有卓越定位能力
2、證明了所提出網路能定位出“區別性”區域，且分類效果也不差

1 介紹

擴寫摘要，展示結果圖

引出GAP的功能遠不止正則化，更重要的是定位能力
指出本文所提網路保留了定位能力且分類能力也不差

1.1 相關研究(研究現狀)

已有研究證明：CNN分類能和定位能力都很好
介紹已有研究的兩個主要工作&提出缺陷
- 弱監督物體定位
- 缺陷：作者並沒有評估定位能力；不是端到端的訓練，需要額外工作，可擴充套件性差
- 視覺化CNN內在表現
- 缺陷：只分析了卷積層，忽略了全連線層，因此是不全面的；只展示了深層特徵中什麼資訊被保留，並沒有凸顯出這些資訊的相對重要性

2 類啟用圖（CAM）

作用：展示被劃分為某個特定類的“區別性”區域
網路結構
詳細計算推理過程
對於一個圖，用f_k(x, y)代表最後一個卷積層的單元k在空間座標（x,y）中的啟用值。對於每個單元k，通過GAP後的結果F^k為∑_x,yf_k(x, y)。則，對於每個類c，輸入softmax的S_c為∑_kw_c,kF_k，w_c,k代表單元k對應的類c的權重。實際上，w_c,k就是F_k對類c的重要性。最後類c的sotfmax輸出P_c為exp(S_c)/∑_c

exp(S_c)。這裡我們忽略偏差項：我們明確地把softmax的偏差項設定為0因為它幾乎對分類表現沒有影響。
把F_k=∑_x,yf_k(x, y)帶入S_c，得

我們用M_c定義類別c的CAM，則空間每個元素為

則S_c = ∑_x,yM_c(x,y)，所以M_c(x,y)直接表明了把空間網格（x,y）啟用對圖片劃分為類別c的的重要性。
對比使用GAP 和 GMP

3 弱監督物體定位

評估了CAM的定位能力
- 3.1 不同CNN網路的設定
- 3.2 定位的同時不影響分類效能

4 通用的定位特徵

我們網路即使在陌生資料上（不訓練）也能定位
- 4.1 鳥類細粒度識別與定位能力評估
- 4.2 證明GoogLeNet-GAP能用於圖片通用模式識別

5 視覺化特定類單元

6 結論

提出CAM技術
證明了CAM在定位方面的泛化能力

寫作套路

摘要
    開頭
        In this work, we ...
    對比
        While ... , we ...
    介紹自己工作
        Despite ...  we ...
        We demonstrate that our ...
    最先進的技術
         state-of-the-art 
研究現狀
    引用前人研究
        Recent work by xxx has shown that ...
        xxx et al propose a technique/method for ...
        These approaches ...
    介紹自己研究
        In our experiments, we found that ...
        our approach is ...
    xxx 遠不止能做()工作，更重要的是還能()
        the advantages of xxx extend beyond () - In fact,  () can
        we can generalize this ability beyond just ()
    引出文章創新
        However, their ...
        Both of these works only analyze ... , ignoring ...
        While these works can ..., they only show ...
        Unlike xxx and xxx, our approach can ...
        Overall, our approach provides ...
正文
    開頭
        In this section, we describe the procedure for ...
    技術可以用於()
        This technique can be applied to do sth.
    研究成功
        This suggests that our approach works as expected.
通用
    如圖所示
         xxx is illustrated in Fig. 2. 
        As shown in Figure 1
    如表所示
         Tbl.1summarizes ...
    本質上講
        In fact
        Essentially, xxx indicates ...
    形容表現的詞
        remarkable ability
        impressive performance
        generic
    連線詞
        further
        In general
        specificly

文章參考論文

參考論文

CAM論文剖析（Learning Deep Features for Discriminative Localization）

英文原文請點這裡譯文請點這裡文章內容剖析實驗程式碼在這裡. 摘要本文主要工作 1、闡述GAP如何使CNN具有卓越定位能力 2、證明了所提出網路能定位出“區別性”

《Learning Deep Features for Discriminative Localization》文章解讀

摘要在這項工作中，我們重新審視了《 Network in network》中提出的全域性平均池化層（global average pooling），並闡明瞭它是如何通過圖片標籤就能讓卷積神經網路具有卓越的定位能力。雖然這項技術以前被當做正則化訓練的一種方法，但是我們發現它實際構建了一種通用的適

論文筆記：Learning Region Features for Object Detection

中心思想繼Relation Network實現可學習的nms之後，MSRA的大佬們覺得目標檢測器依然不夠fully learnable，這篇文章類似之前的Deformable ROI Pooling，主要在ROI特徵的組織上做文章，文章總結了現有的各種ROI Pooling變體，提出了一個統一的數學表示式

[Learning Deep Features for Scene Recognition using Places Database]場景分類demo的實現

需要預先安裝包： numpy pytorch opencv-python Pillow 首先將places365的程式碼git到本地： git clone https://github.com/CSAILVision/places365.git

VGGnet論文總結（VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION）

lrn cli 共享融合 loss sca 得到同時 works VGGNet的主要貢獻：　　1、增加了網絡結構的深度　　2、使用了更小的filter（3*3） 1 introduction 這部分主要說明了，由於在所有的卷積網絡上使用了3*3的filter，所以使

【論文閱讀】HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis

ase channels 手機 features feature 輸出傳統 logs evel 轉載請註明出處：https://www.cnblogs.com/White-xzx/ 原文地址：https://arxiv.org/abs/1709.09930 如有不準確或錯

Wasserstein CNN: Learning Invariant Features for NIR-VIS Face Recognition

表現 ted diff 差異 osi asi nta measure mod 承接上上篇博客，在其基礎上，加入了Wasserstein distance和correlation prior 。其他相關工作、網絡細節（maxout operator）、訓練方式和數據處理等基本

論文筆記 Multiomdal Learning and Reasoning for Visual Question Answering (NIPS 2017)

文章的主要貢獻點如下：值得學習的是，文章的寫作挺好的。文章的一個主要思想就是modular neural network，通過學習關於question與image的多模態(multimodal)與多方面(multifaceted)的表徵，在VQA1.與VQA2.0上取得不錯效果。

【論文閱讀】Learning Spatiotemporal Features with 3D Convolutional Networks

【論文閱讀】Learning Spatiotemporal Features with 3D Convolutional Networks 這是一篇15年ICCV的論文，本篇論文提出的C3D卷積網路是3D卷積網路的里程碑，以3D卷積核為基礎的3D卷積網路從此發展起來。論文地址：下載地址

DIM（Learning deep representations by mutual information estimation and maximization）

摘要：許多表示學習只使用已探索過的資料空間（稱為畫素級別），當一小部分資料十分關心語義級別時，該表示學習將不利於訓練。論文提出了無監督表示學習，直接學習和估計資訊內容，統計或結構約束。論文最大化輸入資訊和高階特徵向量之間的互資訊與通過對抗匹配先驗分佈來控制表示學習的特

深度學習論文筆記（六）--- FCN-2015年（Fully Convolutional Networks for Semantic Segmentation）

深度學習論文筆記（六）--- FCN 全連線網路 FullyConvolutional Networks for Semantic Segmentation Author：J Long ， E Shelhamer， T Darrell Year： 2015 1、導

FCN筆記（Fully Convolutional Networks for Semantic Segmentation）

width height training 註意 die str 指標 his repl FCN筆記（Fully Convolutional Networks for Semantic Segmentation）（1）FCN做的主要操作 (a)將之前分類網絡的全連接

Spring Boot學習筆記之使用Spring Boots實現資料庫操作（IntelliJ IDEA+navicat for Sql Server）

這裡使用Spring Boot實現了一個簡單的專案，能夠實現簡單的資料庫操作，工具使用的是IntelliJ IDEA2017.3，資料庫工具使用的是navicat for Sql Server，語言使用的Java。 1.新建一個空的Maven專案 2.匯入需要的jar包 pom.xml:

3D功能如何在PCL中工作（How 3D Features work in PCL）

本文件介紹了PCL中的三維特徵估計方法，並作為對pcl::Feature類內部感興趣的使用者或開發人員的指南。 #理論入門在它們的原始表示中，3D對映系統的概念中所定義的點僅使用其笛卡爾座標x，y，z相對於給定原點來表示。假設座標系的原點不隨時間變化，則在t1和t2獲得的兩個點p1

libgo 原始碼剖析（2. libgo排程策略原始碼實現）

本文將從原始碼實現上對 libgo 的排程策略進行分析，主要涉及到上一篇文章中的三個結構體的定義：排程器 Scheduler（簡稱 S）執行器 Processer（簡稱 P）協程 Task（簡稱 T）三者的關係如下圖所示：本文會列出類內的主要成員和主要函式做以分析。

[機器學習入門] 李巨集毅機器學習筆記-1（Learning Map 課程導覽圖）

在此就不介紹機器學習的概念了。 Learning Map（學習導圖） PDF VIDEO 先來看一張李大大的總圖↓ 鑑於看起來不是很直觀，我“照虎

華碩主機板禁用UEFI安全啟動（Disable Secure Boot for ASUS Motherboard）

新人第一次寫部落格，算是搬運google的答案吧，因為百度了兩三個小時一直沒解決問題，google了一次出來一個youtube視訊便解決了，有種說不出來的鬱悶(￣﹏￣；)。先介紹下背景，最近配了臺新電腦準備搞DeepLearning, 華碩B150 + i5 6500 +

2017年數學建模大賽A題剖析（第一問求解間距思路分析）

第一問：間距問題製作人：王代文一種典型的二維CT系統如圖1所示，平行入射的X射線垂直於探測器平面，每個探測器單元看成一個接收點，且等距排列。X射線的發射器和探測器相對位置固定不變，整個發射-接收系統

二維陣列練習（二維陣列+for+if...else）

package com.arraydemo; import java.util.Scanner; public class TwoArrayDemo {public static void main(String[] args) {/*1、定義一個三行兩列的整型二維陣列in

02第一個HTML剖析（宣告字符集，utf8亂碼問題）

<span style="font-size:18px;"><html> <head> <title> 標題 - title </titl

CAM論文剖析（Learning Deep Features for Discriminative Localization）

文章內容剖析

摘要

本文主要工作

1 介紹

擴寫摘要，展示結果圖

1.1 相關研究(研究現狀)

2 類啟用圖（CAM）

3 弱監督物體定位

4 通用的定位特徵

5 視覺化特定類單元

6 結論

寫作套路

文章參考論文

相關推薦