1. 程式人生 > >陳俊嶺的程式設計師之路(公眾號求關注,方便交流)

陳俊嶺的程式設計師之路(公眾號求關注,方便交流)

如果覺得這篇文章對您有所啟發,歡迎關注我的公眾號,我會盡可能積極和大家交流,謝謝。 


  轉眼間已經研二了,突然想把以前看過的文獻總結總結與大家分享,留作紀念,方便以後參考。

  1、深度追蹤:通過卷積網路進行差異特徵學習的視覺追蹤(DeepTrack:Learning Discriminative Feature Representations by Convolutional Neural Networks for visual Tracking)(英文,會議論文,2014年,EI檢索)

  將卷積神經網路用於目標跟蹤的一篇文章,可將CNN不僅僅可以用做模式識別,做目標跟蹤也是可以,畢竟本質上是一種特徵提取的手段。

  2、基於深度學習的車標識別方法研究(中文,期刊,2015年,知網)

  將傳統CNN用於車標識別,先進行車標定位提取,在送入CNN中進行訓練,最後採用支援向量機進行分類,屬於老方法新問題。實驗硬體配置:主頻2.80GHZCPU,2G記憶體,未用到GPU加速。

  3、基於深度學習網路的射線影象缺陷識別方法(中文,期刊,2014年,知網)

  將CNN直接用於射線影象缺陷檢測,老方法新問題,對CNN結構描述得很清楚,適合CNN入門。

  4、深度學習及其在目標和行為識別中的新進展(中文,期刊,2014年,知網)

  主要綜述了深度學習中自編碼器和限制玻爾茲曼機的結構以及應用進展,綜述比較全面,也夠權威,對兩者的原理和改進進展都描述得很清楚,指出“深度學習得到的是一個多層深度結構,訊號在這個多層結構中進行傳播,最後得到訊號的表達,學習到多層的非線性的函式關係,更好的對視覺資訊進行建模”,值得參考。

  5、基於超畫素卷積神經網路的顯著性目標檢測(Super CNN:A Superpixel wise Convolutional Neural Network for salient object detection)(英文,期刊,2015年,IEEE檢索)

  CNN在目標檢測領域的應用,先對影象進行超畫素分割,得到三個序列(超畫素序列,一個空間核矩陣,一個範圍核矩陣),然後將三個序列送入三個卷積網路中進行訓練,實現CNN的多通道輸入,顯著性主要通過超畫素來體現。不過文章實驗的訓練速度超級慢,需要4天到6天。

  6、級聯特徵學習人臉識別(Joint Feature Learning for face Recognition)(英文,期刊,2015年,IEEE檢索)

  基本思想是“影象分塊+深度學習”,並且實現訓練的無監督化,類似於sparsity演算法,是對深度學習的抽象借鑑,即只借鑑了“深度”的概念,文章傳遞出一個重要資訊:所謂的深度網路,就是在一層層的尋找對映矩陣,矩陣中的每個係數都是待學習的引數。

  7、使用稀疏表示和隨機對映的魯棒行人計數(Robust people counting using sparse representation and random projection)(英文,期刊,2015年,IEEE檢索)

  將CNN用於行人檢測,實現了訓練的半監督化,其實就是sparsity演算法,沒有分塊思想,沒有超畫素思想。

  8、聯合深度學習的行人檢測(Joint Deep Learning for Pedestrain Detection)(英文,會議論文,2013年,IEEE檢索)

  將CNN用於行人檢測。其實CNN在行人檢測方面的應用相對較多,改進方式也多種多樣。本文結合行人檢測中的形變模型,對人體各個部分進行部件檢測並打分,在形變層借鑑深度學習模型原理,屬於對CNN的抽象改進。

  9、基於多類別預測的深度學習人臉表示(Deep Learning Face Representation from Predicting 10000 classes)(英文,會議,2014年,IEEE檢索)

  香港中文大學DeepID一代演算法文章,將CNN用於人臉認證,先對影象進行人臉關鍵點檢測,並進行分塊,CNN結構中採用Relu啟用函式,並採樣後兩層對映結果進行特徵融合,與聯合貝葉斯分類器相結合,在CelebFace和LFW資料庫上進行實驗,達到97%正確率。

  10、基於聯合人臉認證確認的深度學習人臉表示(Deep Learning Face Representation by Joint Identification Verification)(英文,會議,2014年,NIPS)

  香港中文大學DeepID二代演算法文章,在一代演算法基礎上新增驗證訊號進行改進,並通過確認訊號和驗證訊號的結合使用,提高類間離散度,降低類內離散度,並對多種確認訊號進行了對比,在實驗資料庫上做了擴充,正確率達到99.15%

  11、深度學習人臉表示的稀疏性、選擇性和魯棒性(Deep Learning face representation are sparse,selective and robust)(英文,會議,2014年,CVPR)

  香港中文大學DeepID三代演算法文章,輸出層由160維提高到512維,擴充實驗資料庫(29萬張訓練樣本),對每層神經網路都新增驗證訊號(二代演算法只驗證後兩層),同時對前兩代演算法進行總結,用實驗論證CNN輸出的稀疏性、選擇性和魯棒性,對CNN資料含義做了一定解釋。