1. 程式人生 > >影象處理和計算機視覺中的經典論文(部分)

影象處理和計算機視覺中的經典論文(部分)

自己視野狹小,不敢說全部,只是把自己熟悉的方向中的部分經典文章列出來了。經典的論文,讀得怎麼透都不過分。有人說關於配準的文章太多了,其實我也不太關注這方面,不過由於它們引用率都比較高,就都列出來了,不過在zip包裡一篇都沒有。不關注這方面的可以無視之。

文件和論文下載地址:

1990年之前

1990年

T Lindeberg

Lindeberg關於scale space比較早的一篇,後續還有好幾篇

anzad, A.; Hong, Y.H.

Invariant image recognition by Zernike moments

Zernike moment,做過模式識別或者檢索的應該都知道這個東東

1991年

W Freeman, E Adelson.

Freeman最早的一篇力作,也是我讀的第一篇學術論文。現在Freeman在MIT風生水起,早已是IEEE Fellow了

Michael J. Swain , Dana H. Ballard

google scholar上引用將近五千次

MA Turk

CVPR

Face recognition using eigenfaces

1992年

1993年

1994年

1995年

TF COOTES

Active Shape Models-Their Training and Application

ASM

C Cortes, V Vapnik.

SVM在計算機視覺中也有著非常重要的地位

1996年

Tai Sing Lee

Image Representation Using 2D Gabor Wavelets

Google引用也有近千次

Amir Said,  A. Pearlman

A New, Fast, and Efficient Image Codec Based on Set Partitioning in Hierarchical Tree

SPIHT。影象壓縮領域與EBCOT齊名的經典演算法。

L P Kaelbling, M L Littman, A W Moore.

機器學習裡面的一篇綜述,引用率比較高,就列在這了。

Texture features for browsing and retrieval of image data

檢索的文章比較多,其實它們的應用不僅僅是檢索。只要是需要提取特徵的地方,檢索裡面的方法都可以用到

comparing images using color coherence vectors

檢索中的CCV方法

Image retrieval using color and shape

關於形狀特徵後面有一篇綜述

1997年

1998年

1998年是影象處理和計算機視覺經典文章井噴的一年。大概從這一年開始,開始有了新的趨勢。由於競爭的加劇,一些好的演算法都先發在會議上了,先佔個坑,等過一兩年之後再擴充套件到會議上。

T Lindeberg

Feature detection with automatic scale selection

Linderberg的scale space到此為止基本結束了。在一些邊緣提取,道路或者血管檢測中,scale space確實是一種很不錯的工具

C Tomasi, R Manduchi.

做過影象濾波平滑去噪或者HDR的應該都知道Bilateral filter。原理非常非常簡單,簡單到一個公式就可以概括這篇文章,簡單到實在無法擴充到期刊。這也是Tomasi第二次出現了。一直很納悶,這個很直觀的思想在這之前怎麼就從來沒人提呢。

C Xu, J L Prince.

終於碰到中國人寫的文章了,很榮幸還是校友。GVF是snake和level set領域的重要分支和方法

Daubechies Wim Sweldens

Factoring wavelet transforms into lifting steps

另一位作者也很牛,小波十講的作者

H A Rowley, S Baluja, T Kanade.

做人臉的應該是必看的了。不做人臉的話應該可以不用看吧

T F Cootes, G J Edwards, C J Taylor.

Active Appearance Models

AAM

1999年

2000年

世紀之交,各種綜述都出來了

J Shi, J Malik.

NCuts的引用率相當高,Jianbo Shi也因為這篇文章成為計算機視覺界引用率最高的作者之一

A K Jain, R P W Duin, J C Mao.

統計模式識別綜述,這一年pami上兩篇很有名的綜述之一。在這裡推薦Web寫的Statistical Pattern Recognition第三版,相當不錯,網上有電子版。

C Stauffe

Learning Patterns of Activity Using Real-Time Tracking

搜TLD的時候發現這篇文章引用率也很高,兩千多次。還沒來得及讀。

A W M Smeulders, M Worring, S Santini, A Gupta, R Jain.

在世紀之交對影象檢索的一篇很權威的綜述。感覺在這之後檢索的研究也沒那麼熱了。不過在工業界熱度依舊,各大網上購物平臺,比如淘寶, 亞馬遜,京東等都在做這方面的研發,衣服檢索是一個很不錯的應用點。

PicToSeek Combining Color and Shape Invariant Features for Image Retrieval

依然是檢索特徵

2001年

Paul Viola, Michael J Jones.

這是一篇很牛的文章,在人臉檢測上幾乎成了標準。比較坑爹的是,號稱發在IJCV2001上,但怎麼找也找不到。應該是IJCV2004年的那篇“Robust real-time face detection”吧。

他們在這一年另一篇比較出名的文章是在CVPR上的“Rapid Object Detection using a Boosted Cascade of Simple Features”這篇才是04年那篇著名文章的會議版。

A M Martinez, A C Kak.

PCA也是計算機視覺中非掌握不可的工具。LDA在模式識別中有很重要的地位

2002年

Ming-Husan Yang, David J Kriegman, Narendra Ahuja.

人臉檢測綜述,引用率想不高都難

R Hsu, M Abdel-Mottaleb.

依然是人臉檢測,名字都起得這麼霸氣

J-L Starck, E J Candès, D L Donoho.

Geometrical wavelet中的一篇代表作。其他的如ridgelet, contourlet, bandelet等在這裡就不贅述了。研究這方面的很容易找到這方面的經典文獻。個人以為不研究這方面的看了後對自己的研究也不會有多大啟發。曾經以為這個方向會很火,到最後還是沒火起來。 我覺得原因可能是現在儲存和傳輸能力的大大提高,使得對壓縮的需求沒有那麼大了,這方面的研究自然就停滯了,就如同JPEG2000沒有成氣候一樣。

Shape matching and object recognition using shape contexts

Shape context。用形狀匹配達到目標識別目的。這方面最經典的文章了。隨後後續也有一些這方面的文章,但基本都是很小的改進或者應用。作者提供了原碼,可以在matlab上執行看看效果。

A tutorial on particle filters for online nonlinear non-Gaussian Bayesian tracking

particle filter的一個綜述

2003年

2004年

Lucas-Kanade 20 Years On A Unifying Framework

引用文章摘要的第一句話

Since the Lucas-Kanade algorithm was proposed in 1981 image alignment has become one of the most

widely used techniques in computer vision. Applications range from optical flow and tracking to layered motion, mosaic construction, and face coding.

Chih-Chung Chang, Chih-Jen Lin.

我實在懷疑引用這篇文章的人是否都看過這篇文章。貌似不看這篇文章也可以使用LIBSVM

Review of shape representation and description techniques

Efficient Graph-Based Image Segmentation

2005年

Geodesic active regions and level set methods for motion estimation and tracking

Chunming Li, Chenyang Xu, Changfeng Gui, and  Martin D. Fox

Level Set Evolution Without Re-initialization: A New Variational Formulation

A Performance Evaluation of Local Descriptors

前面那篇是會議的,這篇是PAMI上的。比較各種描述子的,包括SIFT

2006年

2007年

A Review of Statistical Approaches to Level Set Segmentation: Integrating Color, Texture, Motion and Shape

The Appearance of Human Skin:

A Survey

Local Invariant Feature Detectors: A Survey

2008年

P. Felzenszwalb, D. McAllester, D. Ramanan

A Discriminatively Trained, Multiscale, Deformable Part Model

2008年的CVPR,到現在引用已有四百多次,潛力巨大。rosepink提供

2009年

2010年

2011年

Hough Forests for Object Detection, Tracking, and Action Recognition

Robust Principal Component Analysis?

Candes 和UIUC的Ma Yi等人

2012年

Zdenek Kalal, Krystian Mikolajczyk, and Jiri Matas,

Tracking-Learning-Detection

PAMI上的,雖然還沒有正式發表,但肯定會火。在作者的主頁上有幾篇相關的會議文章,demo和code。用到了Lucas-Kanade方法