21世紀初最有影響力的20篇計算機視覺期刊論文及鄧亞峰老師關於人臉識別方面總結

阿新 • • 發佈：2019-02-17

選取論文的原則：

（1）期刊論文，主要來源於以下期刊：TPAMI，IJCV，TIP，CVIU，IVC，MVA，PR，JMIV，IJPRAI…

（2）發表在2000年以後

（3）SCI檢索次數大於1000，來源於Web of Science資料庫，2012年12月初的檢索結果

Top 20 榜單如下：

補充2篇TPAMI，山老師推薦的，南理工楊健老師的2DPCA和浙大何曉飛老師的LPP。

[1] J. Yang, D. Zhang, A. Frangi, and J. Yang, “Two-dimensional PCA: a new approach to appearance-based face representation and recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 26, no. 1, pp. 131-137, Jan, 2004. (Cited=625)

[2] X. He, S. Yan, Y. Hu, P. Niyogi, and H. Zhang, “Face recognition using Laplacianfaces,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 27, no. 3, pp. 328-340, Mar, 2005. (Cited=724)

簡單小結：

3篇IJCV，14篇TPAMI，2篇TIP，1篇IVC倒是有些意外，不過是綜述性質的文章，也是情理之中。

歡迎各位大牛對每篇文章進行點評。

今天在微博看到一篇部落格“21世紀初最有影響力的20篇計算機視覺期刊論文”

，原文請見：http://www.cnblogs.com/youth0826/archive/2012/12/04/2801481.html

首先感謝博主的分享精神，博主的選取原則也很明確，如博文最開始所寫：

選取論文的原則：

（1）期刊論文，主要來源於以下期刊：TPAMI，IJCV，TIP，CVIU，IVC，MVA，PR，JMIV，IJPRAI…

（2）發表在2000年以後

（3）SCI檢索次數大於1000，來源於Web of Science資料庫，2012年12月初的檢索結果看了一下這20篇博文，總體上感覺很熟悉，很多文章確實是視覺領域2000年以來的重要工作，於是就很想聊一下自己的看法，和大家交流。我簡單按照所屬領域劃分統計了一下，其中：

1. 與人臉檢測識別直接相關的有3篇，間接相關的1篇，直接相關的包括：7（基於adaboost的人臉檢測），19（人臉檢測的綜述），12（經典的人臉識別測試集FERET的說明），間接相關的是AAM，AAM是人臉alignment的最經典文章，但是由於其提出時並沒有現定於人臉，所以劃分為間接相關； 2. 與區域性描述子直接相關的有3篇，分別是1（sift），15（local descriptor的綜述），17（LBP）； 3. 與立體視覺相關的有3篇：9（攝像機標註方法），10（影象配準綜述），14（這篇文章我不熟悉，所以這樣劃分是否合理也不是很確信）； 4. 與影象分割直接相關的有2篇，間接相關的有1篇，直接相關的包括：2（normlized cut），13（graph-cut的應用），間接相關的是4（mean-shift），mean-shfit可以應用於影象分割，也可以應用於目標跟蹤，算是間接相關； 5. 與物體檢測跟蹤（為了簡單，把檢測和跟蹤劃分到一起，其實這兩類方法在思路上差別很大，單獨劃分更合理，但是從功能角度確實很相似）直接相關的2篇，間接相關的有1篇：3（基於輪廓的物體檢測方法），16（基於kernel的tracking方法）一篇是檢測，一篇是跟蹤，而基於mean-shift的跟蹤方法是particle filter之前最經典的方法，算是間接相關； 6. 與影象檢索匹配相關的文章2篇：6（綜述），11（shape context）； 7. 此外還包括一篇統計模式識別的綜述（8）； 8. 一篇影象質量評估的方法（5）； 9. 行為識別：18（一篇關於行為識別的系統的文章，用到了跟蹤、攝像機標定、行為識別等）；（其中mean-shift被計算了兩次，所以和是21篇）按照每個領域的文章數量由多到少的順序我講一下自己的觀點：

人臉識別領域的論文出現次數最多（這可能和我自己重點關注人臉識別領域有關），是讓我比較意外的，不過這說明從2000年開始，人臉識別方法得到了大家的重點關注，是視覺領域的一個熱點。這幾篇文章中，viola的基於adaboost+haar的人臉檢測方法是經典中的經典，其思想不僅被廣泛應用於物體檢測領域，同時，在啟發了狠多特徵選擇領域的工作，同時，也幫助adaboost一躍成為和svm並列的兩大machine learning利器，我一直認為這篇文章和和lowe的sift都是視覺領域工程方面的經典之作；而AAM方法，也是十分重要的模型，尤其是對於臉部特徵點定位而言，基於aam的改進工作極大促進了特徵點定位的精度，其實這種全域性形狀約束+區域性表觀模型的思路在其他如物體檢測領域也有很多類似思路；

區域性描述子，基本上是視覺領域表示方面十年來最大的一個亮點和趨勢。我們知道模式識別包含兩個方面的內容，一個是特徵提取，用於提供更有鑑別力的表示，一個是機器學習，用來對於特徵表示之後的資料上學習得到分類模型。而區域性描述子已經成為特徵表示的一個共識，無論是物體匹配檢索、物體檢測識別，採用多種區域性描述子表示已經成為基本選擇。而這其中，sift無疑是影響最大的工作之一，其在物體匹配、物體檢索、物體檢測、物體識別等領域都有大量應用。而LBP特徵，作為一種區域性描述特徵，是繼Gabor之後最重要的紋理描述特徵（當然，sift的變種hog也是之一），其有很多變種，在人臉識別、物體檢測、目標分類領域也得到了大量應用；

立體視覺我不熟悉，我就不獻醜了。對於9和14兩篇文章有這麼高的引用率，不知道誰能講講背後的背景？

影象分割可以通過將分割問題看作是一個分組問題，然後定義一個優化目標，通過最優化這個目標來得到最優的模型引數。而graph-cut，是將每個pixel看作圖中的一個節點，將影象分割轉化為一個圖分割問題。而graph-cut是通過最小分割和最小流來得到一個最優模型，2（normlized-cut）是為了克服graph-cut的缺點的一種改進，第2高的引用率應該說明這種方法可以應用於很多領域，包括影象分割和聚類。

物體檢測跟蹤領域是一個十分活躍的領域，而3和16有這麼高的引用率很出乎我的意料，因為這兩種思路在最近基本都不算是主流思路，也許是當年曾經火過一段時間吧；物體檢測識別的經典思路應該有兩種，一種是基於滑動視窗搜尋的，就是viola人臉檢測文章中使用過的，後來，有基於hog+svm的行人檢測的經典論文也是相近的框架，還有一種是基於影象全域性表示的，經典的方法是基於bag of word的方法，在影象檢測、影象分類、影象檢索等領域都有重要應用；而跟蹤的方法，比較經典的包括基於mean shift的方法，基於particle filter的方法，以及基於online-learning的方法，而後來的發展，也越來越將detection和tracking結合到一起，將二者結合到一個框架，其本質思想就是把tracking看作是一個區分前景目標和背景目標的分類問題，而detection提供了前景目標的off-line模型，tracking提供了on-line模型。這個領域論文很多，有一篇綜述寫得還不錯。

影象檢索是當前視覺領域一個十分熱的方向，在搜尋引擎、購物等領域受到很多關注；而6和11遠遠不能涵蓋這個領域的經典。11是早期物體匹配的經典方法，但是，現在用的已經很少。而這方面的最經典工作還應該是基於bag of word的工作。這個工作借鑑了文字搜尋領域的工作，通過視覺詞將影象轉化為類似文字中的文章，視覺特徵用視覺詞頻表示，然後通過倒排的方式，使得大規模影象檢索成為可能。

其它的三篇文章，8作為綜述，確實沒有什麼疑問。5有這麼高的引用，我有點迷惑。影象質量評估雖然在實際中十分重要，但是是個不太活躍的領域，有這麼高的應用有點意外。18的工作比較早，當時能提出基於跟蹤、攝像機標定、行為識別和事件檢測這樣的框架，確實有很棒的前瞻性，可能是因為近幾年智慧視訊監控應用火熱之後，做這個方向的工作多起來的原因吧。

一點建議： 1，建議將綜述排除出去，20篇論文裡面有5篇綜述，雖然綜述很重要，5篇也不是很多，但是在引用次數上綜述確實會佔很大便宜，建議將綜述排除出去，只對提出新方法的文章單獨排名，才能讓大家對哪些新方法的影響力最廣更瞭解； 2，我不知道這個排名方法是否存在瑕疵，或者是資料是否完全正確，因為我覺得從目前的結論來看，這20篇文章還不能算是最有影響力的20篇；以上觀點如果有錯誤，請大家拍磚提醒。

21世紀初最有影響力的20篇計算機視覺期刊論文及鄧亞峰老師關於人臉識別方面總結

21世紀初最有影響力的20篇計算機視覺期刊論文及鄧亞峰老師關於人臉識別方面總結

揭秘21世紀功能最全的微商分銷模式系統定制

大資料告訴你哪部電影最有影響力

Stackoverflow評選的最有影響力IT圖書

推薦｜深度學習領域引用最多的20篇論文，建議收藏！

年度全球區塊鏈最有影響力人物排行榜TOP10

5-21 找出最小值 (20分)

福布斯：歷史最有影響20企業家

30篇計算機視覺和深度學習論文推薦，被國外專家引用最多【可下載】

初窺Linux 之我最常用的20條命令

Java開發程式設計師，最常用的20％技術有哪些？

推薦｜深度學習領域引用量最多的前20篇論文簡介

21世紀最偉大的學習法——順便學習法

21世紀最需要的七種人才

Java程序員，最常用的20％技術有哪些？

12本最具影響力的程序員書籍

廣通軟件獲“2016年度中國最具影響力IT運維管理軟件提供商”殊榮

揭秘21世紀防偽防竄渠道管控系統解決方案

互聯網最有價值行業分析

華信智原：做大學生最有價值的職業培訓

21世紀初最有影響力的20篇計算機視覺期刊論文 及 鄧亞峰老師關於人臉識別方面總結

相關推薦

21世紀初最有影響力的20篇計算機視覺期刊論文及鄧亞峰老師關於人臉識別方面總結