影象處理與計算機視覺：基礎，經典以及最近發展（1）序

阿新 • • 發佈：2019-01-12

1. 為什麼要寫這篇文章

從2002年到現在，接觸影象快十年了。雖然沒有做出什麼很出色的工作，不過在這個領域摸爬滾打了十年之後，發現自己對影象處理和計算機視覺的感情越來越深厚。下班之後看看相關的書籍和文獻是一件很愜意的事情。平常的一大業餘愛好就是收集一些相關的文章，尤其是經典的文章，到現在我的電腦裡面已經有了幾十G的文章。寫這個文件的想法源於我前一段時間整理文獻時的一個突發奇想，既然有這個多文獻，何不整理出其中的經典，共享給大家呢。於是當時即興寫了一個《影象處理與計算機視覺中的經典論文》。現在來看，那個文件寫得及其拙劣，所共享的論文也非常之有限。就算如此，還是得到了一些網友的誇獎，心裡感激不盡。因此，一直想下定決心把這個文章給完善，力求做到儘量全面。

本文是對現有的影象處理和計算機視覺的經典書籍（後面會有推薦）的一個補充。一般的影象處理書籍都是介紹性的介紹某個方法，在每個領域內都會引用幾十上百篇參考文獻。有時候想深入研究這個領域的時候卻發現文獻太多，不知如何選擇。但實際上在每個領域都有那麼三五篇抑或更多是非讀不可的經典文獻。這些文獻除了提出了很經典的演算法，同時他們的Introduction和Related work也是對所在的領域很好的總結。讀通了這幾篇文獻也就等於深入瞭解了這個領域，比單純的看書收穫要多很多。寫本文的目的就是想把自己所瞭解到的各個領域的經典文章整理出來,不用迷失在文獻的汪洋大海里。

2. 影象處理和計算機視覺的分類

按照當前流行的分類方法，可以分為以下三部分：

影象處理：對輸入的影象做某種變換，輸出仍然是影象，基本不涉及或者很少涉及影象內容的分析。比較典型的有影象變換，影象增強，影象去噪，影象壓縮，影象恢復，二值影象處理等等。基於閾值的影象分割也屬於影象處理的範疇。一般處理的是單幅影象。

影象分析：對影象的內容進行分析，提取有意義的特徵，以便於後續的處理。處理的仍然是單幅影象。

計算機視覺：對影象分析得到的特徵進行分析，提取場景的語義表示，讓計算機具有人眼和人腦的能力。這時處理的是多幅影象或者序列影象，當然也包括部分單幅影象。

關於影象處理，影象分析和計算機視覺的劃分並沒有一個很統一的標準。一般的來說，影象處理的書籍總會或多或少的介紹一些影象分析和計算機視覺的知識，比如岡薩雷斯的數字影象處理。而計算機視覺的書籍基本上都會包括影象處理和影象分析，只是不會介紹的太詳細。其實影象處理，影象分析和計算機視覺都可以納入到計算機視覺的範疇：影象處理->低層視覺（low level vision），影象分析->中間層視覺（middle level vision），計算機視覺->高層視覺（high level vision）。這是一般的計算機視覺或者機器視覺的劃分方法。在本文中，仍然按照傳統的方法把這個領域劃分為影象處理，影象分析和計算機視覺。

3. 影象處理和計算機視覺開源庫以及程式語言選擇

目前在影象處理中有兩種最重要的語言：c/c++和matlab。它們各有優點：c/c++比較適合大型的工程，效率較高，而且容易轉成硬體語言，是工業界的預設語言之一。而matlab實現起來比較方便，適用於演算法的快速驗證，而且matlab有成熟的工具箱可以使用，比如影象處理工具箱，訊號處理工具箱。它們有一個共同的特點：開源的資源非常多。在學術界matlab使用的非常多，很多作者給出的原始碼都是matlab版本。最近由於OpenCV的興起和不斷完善，c/c++在影象處理中的作用越來越大。總的來說，c/c++和matlab都必須掌握，最好是精通，當然側重在c/c++上對找工作會有很大幫助。

至於開源庫，個人非常推薦OpenCV，主要有以下原因：

（1）簡單易入手。opencv進入opencv2.x的時代後，使用起來越來越簡單,介面越來越傻瓜化，越來越matlab化。只要會imread,imwrite,imshow和了解Mat的基本操作就可以開始入手了。

（2）Opencv有一堆影象處理和計算機視覺的大牛在維護，bug在逐步減少，每個新的版本都會帶來不同的驚喜。而且它已經或者逐步在移植到不同的平臺,並提供了對Python的很好的支援。

（3）在Opencv上可以嘗試各種最新以及成熟的技術，而不需要自己從頭去寫，比如人臉檢測（Harr，LBP），DPM（Latent SVM），高斯背景模型，特徵檢測，聚類，hough變換等等。而且它還支援各種機器學習方法（SVM，NN，KNN，決策樹，Boosting等），使用起來很簡單。

（4）文件內容豐富，並且給出了很多示例程式。當然也有一些地方文件描述不清楚，不過看看程式碼就很清楚了。

（5）完全開源。可以從中間摳出任何需要的演算法。

（6）從學校出來後，除極少數會繼續在學術圈裡，大部分還是要進入工業界。現在在工業界，c/c++仍是主流，很多公司都會優先考慮熟悉或者精通opencv的。事實上，在學術界，現在opencv也大有取代matlab之勢。以前的demo或者source code，很多作者都願意給出matlab版本的，然後別人再呼哧呼哧改成c版本的。現在作者乾脆給出c/c++版本，或者自己整合到opencv中去，這樣能快速提升自己的影響力。

如果想在影象處理和計算機視覺界有比較深入的研究，並且以後打算進入這個領域工作的話，建議把OpenCV作為自己的主攻方向。如果找工作的時候敢號稱自己精通OpenCV的話，肯定可以找到一份滿意的工作。

4. 本文的特點和結構，以及適合的物件

本文面向的物件是即將進入或者剛剛進入影象處理和計算機視覺領域的童鞋，可以在閱讀書籍的同時參閱這些文獻，能對書中提到的演算法有比較深刻的理解。由於本文涉及到的範圍比較廣，如果能對計算機視覺的資深從業者也有一定的幫助，我將倍感欣慰。為了不至太誤人子弟，每一篇文章都或多或少的看了一下，最不濟也看了摘要(這句話實在整理之前寫的，實際上由於精力有限，好多文獻都只是大概掃了一眼，然後看了看google的引用數，一般在1000以上就放上來了，把這些文章細細品味一遍也是我近一兩年之內的目標)。在成文的過程中，我本人也受益匪淺，希望能對大家也有所幫助。

由於個人精力和視野的關係，有一些我未涉足過的領域不敢斗膽推薦，只是列出了一些引用率比較高的文章，比如攝像機標定和立體視覺。不過將來，由於工作或者其他原因，這些領域也會接觸到，我會逐步增減這些領域的文章。同時文章的挑選也夾帶了一些個人的喜好，比如我個人比較喜歡low level方向的，尤其是IJCV和PAMI上面的文章，因此這方面也稍微多點，希望不要引起您的反感。如果有什麼意見或者建議，歡迎mail我。文章和資源我都會在我的csdn blog和sina ishare同步更新。在此申明：這些論文的版權歸作者及其出版社所有，請勿用於商業目的。

個人blog：

新浪iask地址：

本文的安排如下。第一部分是緒論。第二部分是影象處理中所需要用到的理論基礎，主要是這個領域所涉及到的一些比較好的參考書籍。第三部分是計算機視覺中所涉及到的訊號處理和模式識別文章。由於影象處理與影象分析太難區分了，第四部分集中討論了它們。第五部分是計算機視覺部分。最後是小結。

影象處理與計算機視覺：基礎，經典以及最近發展（1）序

1. 為什麼要寫這篇文章

2. 影象處理和計算機視覺的分類

3. 影象處理和計算機視覺開源庫以及程式語言選擇

4. 本文的特點和結構，以及適合的物件

影象處理與計算機視覺：基礎，經典以及最近發展（1）序

影象處理與計算機視覺：基礎，經典以及最近發展（4）影象處理與分析

影象處理與計算機視覺：基礎，經典以及最近發展（5）計算機視覺

影象處理與計算機視覺：基礎，經典以及最近發展

4.影象處理與計算機視覺：基礎，經典以及最近發展影象處理與分析

影象處理與計算機視覺基礎，經典以及最近發展(一)

【Compute Vision】影象處理與計算機視覺基礎，經典以及最近發展

影象處理與計算機視覺基礎，經典以及最近發展(二)

【計算機視覺】影象處理與計算機視覺基礎，經典以及最近發展

影象處理與計算機視覺基礎、經典以及最近發展

影象處理與計算機視覺基礎、經典以及最近發展

影象處理與計算機視覺基礎相關領域的經典書籍以及論文

影象處理與計算機視覺概述

影象處理與計算機視覺經典論文

影象處理與計算機視覺的經典書籍

CSAPP 深入理解計算機系統 Buflab實驗，緩衝區溢位攻擊實驗（1）

《opencv3程式設計入門》之一：影象處理、計算機視覺與opencv

影象處理、計算機視覺與模式識別“SCI期刊和頂級會議”總結

影象處理、計算機視覺、機器視覺的概念認知

深度學習與計算機視覺：搞懂反向傳播演算法的四個基本方程

影象處理與計算機視覺：基礎，經典以及最近發展（1）序

1. 為什麼要寫這篇文章

2. 影象處理和計算機視覺的分類

3. 影象處理和計算機視覺開源庫以及程式語言選擇

4. 本文的特點和結構，以及適合的物件

相關推薦