1. 程式人生 > >影象處理與計算機視覺:基礎,經典以及最近發展(1)序

影象處理與計算機視覺:基礎,經典以及最近發展(1)序

1. 為什麼要寫這篇文章

  從2002年到現在,接觸影象快十年了。雖然沒有做出什麼很出色的工作,不過在這個領域摸爬滾打了十年之後,發現自己對影象處理和計算機視覺的感情越來越深厚。下班之後看看相關的書籍和文獻是一件很愜意的事情。平常的一大業餘愛好就是收集一些相關的文章,尤其是經典的文章,到現在我的電腦裡面已經有了幾十G的文章。寫這個文件的想法源於我前一段時間整理文獻時的一個突發奇想,既然有這個多文獻,何不整理出其中的經典,共享給大家呢。於是當時即興寫了一個《影象處理與計算機視覺中的經典論文》。現在來看,那個文件寫得及其拙劣,所共享的論文也非常之有限。就算如此,還是得到了一些網友的誇獎,心裡感激不盡。因此,一直想下定決心把這個文章給完善,力求做到儘量全面。

     本文是對現有的影象處理和計算機視覺的經典書籍(後面會有推薦)的一個補充。一般的影象處理書籍都是介紹性的介紹某個方法,在每個領域內都會引用幾十上百篇參考文獻。有時候想深入研究這個領域的時候卻發現文獻太多,不知如何選擇。但實際上在每個領域都有那麼三五篇抑或更多是非讀不可的經典文獻。這些文獻除了提出了很經典的演算法,同時他們的Introduction和Related work也是對所在的領域很好的總結。讀通了這幾篇文獻也就等於深入瞭解了這個領域,比單純的看書收穫要多很多。寫本文的目的就是想把自己所瞭解到的各個領域的經典文章整理出來,不用迷失在文獻的汪洋大海里。

2. 影象處理和計算機視覺的分類

     按照當前流行的分類方法,可以分為以下三部分:

     影象處理:對輸入的影象做某種變換,輸出仍然是影象,基本不涉及或者很少涉及影象內容的分析。比較典型的有影象變換,影象增強,影象去噪,影象壓縮,影象恢復,二值影象處理等等。基於閾值的影象分割也屬於影象處理的範疇。一般處理的是單幅影象。

     影象分析:對影象的內容進行分析,提取有意義的特徵,以便於後續的處理。處理的仍然是單幅影象。

     計算機視覺:對影象分析得到的特徵進行分析,提取場景的語義表示,讓計算機具有人眼和人腦的能力。這時處理的是多幅影象或者序列影象,當然也包括部分單幅影象。

     關於影象處理,影象分析和計算機視覺的劃分並沒有一個很統一的標準。一般的來說,影象處理的書籍總會或多或少的介紹一些影象分析和計算機視覺的知識,比如岡薩雷斯的數字影象處理。而計算機視覺的書籍基本上都會包括影象處理和影象分析,只是不會介紹的太詳細。其實影象處理,影象分析和計算機視覺都可以納入到計算機視覺的範疇:影象處理->低層視覺(low level vision),影象分析->中間層視覺(middle level vision),計算機視覺->高層視覺(high level vision)。這是一般的計算機視覺或者機器視覺的劃分方法。在本文中,仍然按照傳統的方法把這個領域劃分為影象處理,影象分析和計算機視覺。

3. 影象處理和計算機視覺開源庫以及程式語言選擇

     目前在影象處理中有兩種最重要的語言:c/c++和matlab。它們各有優點:c/c++比較適合大型的工程,效率較高,而且容易轉成硬體語言,是工業界的預設語言之一。而matlab實現起來比較方便,適用於演算法的快速驗證,而且matlab有成熟的工具箱可以使用,比如影象處理工具箱,訊號處理工具箱。它們有一個共同的特點:開源的資源非常多。在學術界matlab使用的非常多,很多作者給出的原始碼都是matlab版本。最近由於OpenCV的興起和不斷完善,c/c++在影象處理中的作用越來越大。總的來說,c/c++和matlab都必須掌握,最好是精通,當然側重在c/c++上對找工作會有很大幫助。

   至於開源庫,個人非常推薦OpenCV,主要有以下原因:

(1)簡單易入手。opencv進入opencv2.x的時代後,使用起來越來越簡單,介面越來越傻瓜化,越來越matlab化。只要會imread,imwrite,imshow和了解Mat的基本操作就可以開始入手了。

(2)Opencv有一堆影象處理和計算機視覺的大牛在維護,bug在逐步減少,每個新的版本都會帶來不同的驚喜。而且它已經或者逐步在移植到不同的平臺,並提供了對Python的很好的支援。

(3)在Opencv上可以嘗試各種最新以及成熟的技術,而不需要自己從頭去寫,比如人臉檢測(Harr,LBP),DPM(Latent SVM),高斯背景模型,特徵檢測,聚類,hough變換等等。而且它還支援各種機器學習方法(SVM,NN,KNN,決策樹,Boosting等),使用起來很簡單。

(4)文件內容豐富,並且給出了很多示例程式。當然也有一些地方文件描述不清楚,不過看看程式碼就很清楚了。

(5)完全開源。可以從中間摳出任何需要的演算法。

(6)從學校出來後,除極少數會繼續在學術圈裡,大部分還是要進入工業界。現在在工業界,c/c++仍是主流,很多公司都會優先考慮熟悉或者精通opencv的。事實上,在學術界,現在opencv也大有取代matlab之勢。以前的demo或者source code,很多作者都願意給出matlab版本的,然後別人再呼哧呼哧改成c版本的。現在作者乾脆給出c/c++版本,或者自己整合到opencv中去,這樣能快速提升自己的影響力。

    如果想在影象處理和計算機視覺界有比較深入的研究,並且以後打算進入這個領域工作的話,建議把OpenCV作為自己的主攻方向。如果找工作的時候敢號稱自己精通OpenCV的話,肯定可以找到一份滿意的工作。

4. 本文的特點和結構,以及適合的物件

     本文面向的物件是即將進入或者剛剛進入影象處理和計算機視覺領域的童鞋,可以在閱讀書籍的同時參閱這些文獻,能對書中提到的演算法有比較深刻的理解。由於本文涉及到的範圍比較廣,如果能對計算機視覺的資深從業者也有一定的幫助,我將倍感欣慰。為了不至太誤人子弟,每一篇文章都或多或少的看了一下,最不濟也看了摘要(這句話實在整理之前寫的,實際上由於精力有限,好多文獻都只是大概掃了一眼,然後看了看google的引用數,一般在1000以上就放上來了,把這些文章細細品味一遍也是我近一兩年之內的目標)。在成文的過程中,我本人也受益匪淺,希望能對大家也有所幫助。

    由於個人精力和視野的關係,有一些我未涉足過的領域不敢斗膽推薦,只是列出了一些引用率比較高的文章,比如攝像機標定和立體視覺。不過將來,由於工作或者其他原因,這些領域也會接觸到,我會逐步增減這些領域的文章。同時文章的挑選也夾帶了一些個人的喜好,比如我個人比較喜歡low level方向的,尤其是IJCV和PAMI上面的文章,因此這方面也稍微多點,希望不要引起您的反感。如果有什麼意見或者建議,歡迎mail我。文章和資源我都會在我的csdn blog和sina ishare同步更新。在此申明:這些論文的版權歸作者及其出版社所有,請勿用於商業目的。

個人blog:

新浪iask地址:

     本文的安排如下。第一部分是緒論。第二部分是影象處理中所需要用到的理論基礎,主要是這個領域所涉及到的一些比較好的參考書籍。第三部分是計算機視覺中所涉及到的訊號處理和模式識別文章。由於影象處理與影象分析太難區分了,第四部分集中討論了它們。第五部分是計算機視覺部分。最後是小結。

相關推薦

影象處理計算機視覺基礎經典以及最近發展1

1. 為什麼要寫這篇文章   從2002年到現在,接觸影象快十年了。雖然沒有做出什麼很出色的工作,不過在這個領域摸爬滾打了十年之後,發現自己對影象處理和計算機視覺的感情越來越深厚。下班之後看看相關的書籍和文獻是一件很愜意的事情。平常的一大業餘愛好就是收集一些相關的文章,尤其

影象處理計算機視覺基礎經典以及最近發展4影象處理分析

Last update: 2012-6-3 本章主要討論影象處理與分析。雖然後面計算機視覺部分的有些內容比如特徵提取等也可以歸結到影象分析中來,但鑑於它們與計算機視覺的緊密聯絡,以及它們的出處,沒有把它們納入到影象處理與分析中來。同樣,這裡面也有一些也可以劃歸到計算機視覺中

影象處理計算機視覺基礎經典以及最近發展5計算機視覺

Last update: 2012-6-7 這一章是計算機視覺部分,主要側重在底層特徵提取,視訊分析,跟蹤,目標檢測和識別方面等方面。對於自己不太熟悉的領域比如攝像機標定和立體視覺,僅僅列出上google上引用次數比較多的文獻。有一些剛剛出版的文章,個人非常喜歡,也列出來

影象處理計算機視覺基礎經典以及最近發展

轉自:http://blog.csdn.net/dcraw/article/details/7617891 由於新浪愛問關閉了,把文章都放在了百度雲盤裡 歷時一個多月,終於用業餘時間把這些資料整理出來了。以後可能會有些小修小補,但不會有太大的變化了。萬里長征走完

4.影象處理計算機視覺基礎經典以及最近發展 影象處理分析

本章主要討論影象處理與分析。雖然後面計算機視覺部分的有些內容比如特徵提取等也可以歸結到影象分析中來,但鑑於它們與計算機視覺的緊密聯絡,以及它們的出處,沒有把它們納入到影象處理與分析中來。同樣,這裡面也有一些也可以劃歸到計算機視覺中去。這都不重要,只要知道有這麼個方法,能為

影象處理計算機視覺基礎經典以及最近發展(一)

在小波變換之前,時頻分析的工具只有傅立葉變換。眾所周知,傅立葉變換在時域沒有解析度,不能捕捉區域性頻域資訊。雖然短時傅立葉變換克服了這個缺點,但只能刻畫恆定視窗的頻率特性,並且不能很好的擴充套件到二維。小波變換的出現很好的解決了時頻分析的問題,作為一種多解析度分析工具,在影象處理中得到了極大的發展和應用。在小

【Compute Vision】影象處理計算機視覺基礎經典以及最近發展

**************************************************************************************************************************************

影象處理計算機視覺基礎經典以及最近發展(二)

背景建模一直是視訊分析尤其是目標檢測中的一項關鍵技術。雖然最近一直有一些新技術的產生,demo效果也很好,比如基於dynamical texture的方法。但最經典的還是Stauffer等在1999年和2000年提出的GMM方法,他們最大的貢獻在於不用EM去做高斯擬合,而是採用了一種迭代的演算法,這樣就不需要

計算機視覺影象處理計算機視覺基礎經典以及最近發展

  在這裡,我特別宣告:本文章的源作者是   楊曉冬  (個人郵箱:[email protected])。原文的連結是 http://www.iask.sina.com.cn/u/2252291285/ish。版權歸 楊曉冬 朋友所有。      

影象處理計算機視覺 基礎經典以及最近發展

******************************************************************************************************************************************************

影象處理計算機視覺基礎經典以及最近發展

                       影象處理與計算機視覺基礎,經典以及最近發展                                                                                  

影象處理計算機視覺基礎相關領域的經典書籍以及論文

         我非常感謝原作者楊曉冬辛勤地編寫本文章,並願意共享出來。我也希望轉載本文的各位朋友,要註明原作者和出處,以尊重原作者!    一、 緒論 1. 為什麼要寫這篇文章        從2002年到現在,接觸影象快十年了。雖然沒有做出什麼很出色的工作,不過在這個領域摸

影象處理計算機視覺概述

                *******************************************************************************************************************************************

影象處理計算機視覺經典論文

Last update: 2012-6-3 本章主要討論影象處理與分析。雖然後面計算機視覺部分的有些內容比如特徵提取等也可以歸結到影象分析中來,但鑑於它們與計算機視覺的緊密聯絡,以及它們的出處,沒有把它們納入到影象處理與分析中來。同樣,這裡面也有一些也可以劃歸到計算機視覺中去。這都不重要,只要知道有這麼個方

影象處理計算機視覺經典書籍

************************************************************************************************************************************

CSAPP 深入理解計算機系統 Buflab實驗緩衝區溢位攻擊實驗1

由於實驗太長所以還是採用分開 其實感覺之前做過那個bomb實驗以後,這個實驗相對來說還是很容易的,主要是要搞懂緩衝區溢位原理,以及堆疊的過程,函式呼叫的實現過程,做完這個實驗如果認認真真的做完,對於堆疊的過程,還有快取溢位攻擊的原理就會掌握的比較清楚的。個人感覺實驗設計的

《opencv3程式設計入門》之一影象處理計算機視覺opencv

本文是我學習  毛星雲  的《opencv3程式設計入門》一書的學習筆記。 1 影象處理          影象處理是用計算機對影象進行分析,以達到所需結果的技術,又稱影像處理。它包括影象壓縮,增強和復原,匹配、描述和識別三個部分。 2 計算機視覺          計算機

影象處理計算機視覺模式識別“SCI期刊和頂級會議”總結

期刊: best (1) IEEE Transactions on Pattern Analysis and Machine Intelligence,IEEE模式分析與機器智慧彙刊,簡稱PAMI,是IEEE最重要的學術性彙刊之一。 (2) ACM Trans

影象處理計算機視覺、機器視覺的概念認知

影象處理:用計算機來對影象進行分析,以達到所需的結果。一般指數字影象處理,指的是通過計算機對圖片進行去噪聲、增強、復原、分割、提取特徵等的方法和技術。 計算機視覺:計算機視覺是利用計算機和其輔助裝置來

深度學習計算機視覺 搞懂反向傳播演算法的四個基本方程

BP演算法,在深度神經網路的發展中有著舉足輕重的地位,對於反向傳播演算法的推導過程,各種資料介紹可謂是多不勝數。但,由於深度神經網路的複雜性,要比較深刻的理解反向傳播演算法還是需要自己手動的推導一遍。 本文以前篇深度學習與計算機視覺: 深度學習必知基本概念以及鏈式求導介紹了神經網路的反向傳播中的鏈式求導法則