【論文精讀】Select Via Proxy: Efficient Data Selection For Training DeepNetworks

阿新 • • 發佈：2018-12-14

Select Via Proxy: Efficient Data Selection For Training DeepNetworks

2019ICLR的文章，介紹了Select Via Proxy（SVP）通過較小規模的模型來確定樣本的uncertainty進而決定複雜模型訓練使用樣本的策略。

ABSTRACT

we develop a novel approach to efficiently select a subset of training data to achieve faster training with no loss in model predictive performance.

這是論文的主要貢獻。

In our approach, we first train a small proxy model quickly, which we then use to estimate the utility of individual training data points, and then select the most informative ones for training the large target model.

先訓練一些小的proxy模型去估計訓練樣本的實用性，然後用資訊最豐富（uncertainty最高）的樣本去訓練目標模型。

1 INTRODUCTION

介紹了一下SVP的目的和uniform subsampling和core-set selection兩種方法的缺點。簡單介紹了SVP的流程（圖1）和結果。

在這裡插入圖片描述

2 RELATED WORK

介紹了關於sampling和training data selection的一些文獻，有興趣的可以看一下。

3 SELECT VIA PROXY

3.1 CREATING A PROXY MODEL

總共就三步：

1）Create a proxy model that is fast to train and to provide us with an approximate decision boundary, 2) use the proxy model to select a subset of uncertain data points around the decision boundary, and 3) train the large target model on the selected subset via proxy to refine the decision boundary and get the final accurate model.

這裡作者提出來兩個觀點：

It has been observed that for deep models with many layers, reducing the dimension (narrowing) or number of hidden layers (shortening) leads to a considerably reduced training times with only a small drop in accuracy.

a significant amount of training is spent to obtain a relatively small reduction in error.

這是使用SVP的基本立足點。

3.2 SUBSET SELECTION VIA PROXY

Quantifying uncertainty

介紹了有以下幾種方法：

在這裡插入圖片描述

然後根據Algorithm 1對目標模型進行更新：

在這裡插入圖片描述

4 RESULTS

使用不同的proxy和不同的資料集進行了實驗，結果顯示在達到同樣誤差下，使用了SVP的訓練時間短訓練樣本少。圖5展示不同的uncertainty metrics效果的差異。表2展示了採用了proxy model進行example selection導致的樣本類別不均衡。隨著訓練的繼續和子訓練集規模的增加資料將變得均衡，但從每一個類別裡通過uncertainty選取相同數量的examples往往會導致模型表現不佳。

在這裡插入圖片描述

5 CONCLUSION

提出了一種通過proxy model來選擇子訓練集來訓練深度學習模型的一種方法買這種方法會使得在同樣精度的情況下訓練速度的加快。由於不改變目標模型的訓練，因此此方法可以與任意的模型配合使用。

【論文精讀】Select Via Proxy: Efficient Data Selection For Training DeepNetworks

Select Via Proxy: Efficient Data Selection For Training DeepNetworks 2019ICLR的文章，介紹了Select Via Proxy（SVP）通過較小規模的模型來確定樣本的uncertainty

【論文閱讀】韓鬆《Efficient Methods And Hardware For Deep Learning》節選《Learning both Weights and Connections 》

Pruning Deep Neural Networks 本節內容主要來自NIPS 2015論文《Learning both Weights and Connections for Efﬁcient Neural Networks》。這部分主要介紹如何剪枝網路

【論文精讀】Curriculum Learning

Curriculum Learning 課程學習（Curriculum Learning）由Montreal大學的Bengio教授團隊在2009年的ICML會議上提出，主要思想是模仿人類學習的特點，由簡單到困難來學習課程（在機器學習裡就是容易學習的樣本和不容易

【論文精讀】Dropout: A Simple Way to Prevent Neural Networks from Overfitting

Dropout: A Simple Way to Prevent Neural Networks from Overfitting 來填坑了，上次讀了《Deep Learning under Privileged Information Using Heter

【論文筆記】In Defense of the Triplet Loss for Person Re-Identification

1、前言 Triplet loss是非常常用的一種deep metric learning方法，在影象檢索領域有非常廣泛的應用，比如人臉識別、行人重識別、商品檢索等。傳統的triplet loss訓練需要一個三元組，包括三張圖片：achor,positive,

【論文閱讀】A Closer Look at Spatiotemporal Convolutions for Action Recognition

【論文閱讀】A Closer Look at Spatiotemporal Convolutions for Action Recognition 這是一篇facebook的論文，它和一篇google的論文連結地址的研究內容非常相似，而且幾乎是同一時刻的研究，感覺這兩個公司真的冤家路窄，

【論文閱讀】Meta-SR: A Magnification-Arbitrary Network for Super-Resolution

開發十年，就只剩下這套架構體系了！ >>>

Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base【論文筆記】

一、摘要我們對知識庫問答提出一個新穎的語義解析框架。我們定義了一個類似於知識庫子圖的查詢圖，可以直接對映為邏輯形式。語義解析被簡化為查詢圖生成，被表述為分階段搜尋問題。與傳統方法不同，我們的方法在早期就利用知識庫來修剪搜尋空間，從而簡化語義匹配問題。通過應用實體鏈指系統和深度卷

【論文閱讀】EAST: An Efficient and Accurate Scene Text Detector

任務：文字檢測(可以檢測傾斜文字) contributions 提出了End-to-End 的全卷積網路來解決文字檢測問題可以根據特定的應用生成quardrangles或者是rotated boxes兩種格式的幾何標註改進了stat

【論文筆記】Domain Adaptation via Transfer Component Analysis

測試 lin ack 利用參考文獻 program clas rim ast 論文題目：《Domain Adaptation via Transfer Component Analysis》論文作者：Sinno Jialin Pan, Ivor W. Tsang, Ja

【論文閱讀】Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel......

開發十年，就只剩下這套架構體系了！ >>>

【論文筆記】T Test

nor thum pan n-1 統計學 for nes 其它 align 用來算兩組數的差別大小只要是一種叫做p-value的就是說假如你測定一個實驗的p-value是5%也就是說你有95%的信心確定這個實驗它是正確的在正規的實驗裏只有當p-value小於5%的時候

【論文翻譯】ResNet論文中英對照翻譯--（Deep Residual Learning for Image Recognition）

【開始時間】2018.10.03 【完成時間】2018.10.05 【論文翻譯】ResNet論文中英對照翻譯--（Deep Residual Learning for Image Recognition）【中文譯名】深度殘差學習在影象識別中的應用【論文連結】https://arx

【論文翻譯】中英對照翻譯--（Attentive Generative Adversarial Network for Raindrop Removal from A Single Image）

【開始時間】2018.10.08 【完成時間】2018.10.09 【論文翻譯】Attentive GAN論文中英對照翻譯--（Attentive Generative Adversarial Network for Raindrop Removal from A Single Imag

【論文閱讀】Siamese Neural Networks for One-shot Image Recognition

關鍵詞： one-short learning : 待解決的問題只有少量的標註資料，先驗知識很匱乏，遷移學習就屬於one-short learning的一種 zero-short learning: 這個種情況下完全沒有

Reading Wikipedia to Answer Open-Domain Questions【論文筆記】

一、摘要這篇文章主要是介紹使用維基百科作為唯一的知識庫來解決開放域問答。大規模機器閱讀任務的主要挑戰是文件檢索（查詢相關文章）和機器閱讀理解（從文章中確定答案片段）。作者的方法將基於bigram hashing 和TF-IDF匹配的搜尋元件與經過訓練以檢測維基百科段落中的答案的多層

Question Answering over Freebase with Multi-Column Convolutional Neural Networks【論文筆記】

一、概要通過知識庫回答自然語言問題是一個重要的具有挑戰性的任務。大多數目前的系統依賴於手工特徵和規則。本篇論文，我們介紹了MCCNNs，從三個不同層面（答案路徑，答案型別，答案上下文）來理解問題。同時，在知識庫中我們共同學習實體和關係的低維詞向量。問答對用於訓練模型以對候選答案

Context-Aware Basic Level Concepts Detection in Folksonomies【論文筆記】

一、概要這篇論文討論了在 folksonomies中探索隱含語義的問題。在 folksonomies中，使用者建立和管理標籤來標註web資源。使用者建立的標籤的集合是潛在的語義資源。做了大量研究來抽取概念，甚至概念層次 (本體)，這是知識表示的重要組成部分。沒有用於發現人類可接受和令人滿意

Question Answering with Subgraph Embeddings【論文筆記】

一、摘要這篇論文提出一個系統，在大範圍主題的知識庫中，學習使用較少的手工特徵來回答問題。我們的模型學習單詞和知識庫組成的低維詞向量。這些表示用於根據候選答案對自然語言問題打分。使用成對的問題和對應答案的結構化表示，和成對的問題釋義來訓練系統，在最近的文獻基準中產生有競爭力的結果。 &n

Information Extraction over Structured Data: Question Answering with Freebase【論文筆記】

Information Extraction over Structured Data:Question Answering with Freebase 一、摘要

【論文精讀】Select Via Proxy: Efficient Data Selection For Training DeepNetworks

Select Via Proxy: Efficient Data Selection For Training DeepNetworks

ABSTRACT

1 INTRODUCTION

2 RELATED WORK

3 SELECT VIA PROXY

3.1 CREATING A PROXY MODEL

3.2 SUBSET SELECTION VIA PROXY

4 RESULTS

5 CONCLUSION

相關推薦