1. 程式人生 > >影象處理基本概念筆記(3)

影象處理基本概念筆記(3)

著作權歸作者所有。
商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。
作者:cvvision
連結:http://www.cvvision.cn/8910.html
來源:CV視覺網

三、 31、機器視覺基本功能

測量、定位、識別、檢測

32、英寸 1英寸=25.4 mm 但是在CCD中間1英寸=16mm 比如:CCD尺寸1/3”: 指CCD對角線長度為1/3英寸。 說明:這是歷史問題導致的,那時早期的電視攝像機使用的感光元件是真空管,現在常見的CCD和CMOS感測器,那時候還沒發明出來呢。真空管的外面是有個玻璃罩子的,真空管外徑是把玻璃厚度也算進去的。玻璃管當然是不能用於成像的,所以外徑1英寸的真空管,實際成像區域只有16mm左右,於是16mm就成了電子攝像照相行業一個約定俗成的度量單位。 雖然真空管成像技術現在已經不使用了,但是這種度量方式卻被一直繼承了下來。 所以現在數碼成像元件中提到英寸這個單位,都不能按工業標準的1英=25.4mm來計算,而要按1英寸=16mm來計算。

33、數字影象處理 數字影象處理(Digital Image Processing)是通過計算機對影象進行去除噪聲、增強、復原、分割、提取特徵等處理的方法和技術。又稱為計算機影象處理,它是指將影象訊號轉換成數字訊號並利用計算機對其進行處理的過程。 主要目的: (1)提高影象的視感質量,如進行影象的亮度、彩色變換,增強、抑制某些成分,對影象進行幾何變換等,以改善影象的質量。

(2)提取影象中所包含的某些特徵或特殊資訊,提取特徵或資訊的過程是模式識別或計算機視覺的預處理。

(3)影象資料的變換、編碼和壓縮,以便於影象的儲存和傳輸。

常用方法:

1)影象變換:由於影象陣列很大,直接在空間域中進行處理,涉及計算量很大。如傅立葉變換、沃爾什變換、離散餘弦變換等間接處理技術,將空間域的處理轉換為變換域處理。

2 )影象編碼壓縮:影象編碼壓縮技術可減少描述影象的資料量,以便節省影象傳輸、處理時間和減少所佔用的儲存器容量。

3 )影象增強和復原:影象增強和復原的目的是為了提高影象的質量,如去除噪聲,提高影象的清晰度等。

4 )影象分割,將影象中有意義的特徵部分提取出來,其有意義的特徵有影象中的邊緣、區域等,這是進一步進行影象識別、分析和理解的基礎。

5 )影象描述,作為最簡單的二值影象可採用其幾何特性描述物體的特性,一般影象的描述方法採用二維形狀描述。

6 )影象分類(識別),其主要內容是影象經過某些預處理(增強、復原、壓縮)後,進行影象分割和特徵提取,從而進行判決分類。 基本特點:處理資訊量很大、佔用頻帶較寬、各畫素相關性大、無法復現全部資訊、受人的因素影響較大,看完百度百科的精簡總結。

34、模擬/數字影象 又稱連續影象,是指在二維座標系中連續變化的影象,即影象的像點是無限稠密的,同時具有灰度值(即影象從暗到亮的變化值)。連續影象的典型代表是由光學透鏡系統獲取的影象,如人物照片和景物照片等,有時又稱模擬影象。 模擬影象是通過某種物理量的強弱變化來表現影象上各個點的顏色資訊的,印刷品影象、相片、畫稿上的影象都是模擬影象。模擬圖象是連續的點組成。 數字影象:數字影象,是以二維數字組形式表示的影象,其數字單元為像元,數字影象的恰當應用通常需要數字影象與看到的現象之間關係的知識,也就是幾何和光度學或者感測器校準,數字影象處理領域就是研究它們的變換演算法。數字影象,又稱數碼影象或數點陣圖像,是二維影象用有限數字數值畫素的表示。由陣列或矩陣表示,其光照位置和強度都是離散的。數字影象是由模擬影象數字化得到的、以畫素為基本元素的、可以用數字計算機或數位電路儲存和處理的影象。

35、畫素/解析度/深度等 畫素:由一個數字序列表示的影象中的一個最小單位。可以理解為一個二維陣列的一個元素,其值大小表示灰度(強度) 灰度:灰度是表明影象明暗的數值,即黑白影象中點的顏色深度,範圍一般從0到255,白色為255 ,黑色為0,故黑白圖片也稱灰度影象。灰度值指的是單個畫素點的亮度。灰度值越大表示越亮。 動態範圍:系統中最大可度量灰度與最小可檢測灰度之比。上限取決於飽和度,下限取決於噪聲。

對比度:一幅影象中最高和最低灰度級間的灰度差。高動態範圍意味著高對比度。

灰度級:灰度級表明影象中不同灰度的最大數量。灰度級越大,影象的亮度範圍越大。 影象/空間解析度:單位距離可分辨的最大線對數量/畫素數。

灰度解析度:灰度級中可分辨的最小變化。通常說一副被量化為256級的影象有8位元的灰度解析度。

螢幕解析度:螢幕解析度是螢幕每行的畫素點數*每列的畫素點數,每個螢幕有自己的解析度。螢幕解析度越高,所呈現的色彩越多,清晰度越高。 影象所需要的位數b:b=MxNxK MxN是空間解析度,K灰度解析度,單位是bit。 影象深度:是指儲存每個畫素所用的位數,也用於量度影象的色彩解析度。影象深度確定彩色影象的每個畫素可能有的顏色[數,或者確定灰度影象的每個畫素可能有的灰度級數.它決定了彩色影象中可出現的最多顏色數,或灰度影象中的最大灰度等級。比如一幅單色影象,若每個畫素有8位 ,則最大灰度數目為2的8次方,即256。一幅彩色影象RGB3個分量的畫素位數分別為4,4,2,則最大顏色數目為2的4+4+2次方,即1024,就是說畫素的深度為10位,每個畫素可以是1024種顏色中的一種。 影象取樣:對影象空間座標的離散化,它決定了影象的空間解析度。取樣的實質就是要用多少點來描述一幅影象,取樣結果質量的高低就是用前面所說的影象解析度來衡量。簡單來講,對二維空間上連續的影象在水平和垂直方向上等間距地分割成矩形網狀結構,所形成的微小方格稱為畫素點。一副影象就被取樣成有限個畫素點構成的集合。例如:一副640*480解析度的影象,表示這幅影象是由640*480=307200個畫素點組成。

點陣圖:也稱點陣圖,它是由許多點組成的,這些點稱為畫素。當許多不同顏色的點組合在一起後,便構成了一副完整的影象。 點陣圖可以記錄每一個點的資料資訊,從而精確地製作色彩和色調變化豐富的影象。但是,由於點陣圖影象與解析度有關,它所包含的影象畫素數目是一定的,若將影象放大到一定程度後,影象就會失真,邊緣出現鋸齒。 深度:深度即位數(位元數)

①位深:一個畫素點所佔的總位數,也叫畫素深度、影象深度等,其中位深 = 通道數 × 每個通道所佔位數

②256色圖:n位的畫素點可以表示2^n種顏色,稱2^n色圖,n=8時為256色圖

③8位RGB與8點陣圖:前者的位數指每個通道所佔的位數,後者指整個畫素點共佔的位數,其中8位RGB是一個24點陣圖,也稱為真彩。

       對比度:指不同顏色之間的差別。對比度越大,不同顏色之間的反差越大,即所謂黑白分明,對比度過大,影象就會顯得很刺眼。對比度越小,不同顏色之間的反差就越小。對比度=最大灰度值/最小灰度值。

亮度:指照射在景物或影象上光線的明暗程度。影象亮度增加時,就會顯得耀眼或刺眼,亮度越小時,影象就會顯得灰暗。 頻率:灰度值變化劇烈程度的指標,是灰度在平面空間上的梯度。低頻就是顏色緩慢地變化,也就是灰度緩慢地變化,就代表著那是連續漸變的一塊區域,這部分就是低頻。 高頻就是頻率變化快,即相鄰區域之間灰度相差很大,這就是變化得快。影象中,一個影像與背景的邊緣部位的頻率高,即高頻顯示影象邊緣。影象的細節處也是屬於灰度值急劇變化的區域,正是因為灰度值的急劇變化,才會出現細節。另外噪聲(即噪點)也是這樣,在一個畫素所在的位置,之所以是噪點,就是因為它與正常的點顏色不一樣了,灰度有了快速地變化。固有“影象的低頻是輪廓,高頻是噪聲和細節”。 空域:也叫空間域,即所說的畫素域,在空域的處理就是在畫素級的處理,如在畫素級的影象疊加。通過傅立葉變換後,得到的是影象的頻譜。表示影象的能量梯度。 頻域: 也叫頻率域,任何一個波形都可以分解成多個正弦波之和。每個正弦波都有自己的頻率和振幅。所以任意一個波形訊號有自己的頻率和振幅的集合。頻率域就是空間域經過傅立葉變換的訊號。

36、數字影象型別 黑白影象:影象的每個畫素只能是黑或白,沒有中間的過渡,故又稱為二值影象。二值影象的畫素值只有0.1。 灰度影象:灰度影象是每個畫素的資訊由一個量化的灰度級來描述影象,沒有彩色資訊。 彩色影象:彩色影象是指每個畫素的資訊由RGB三原色構成的影象,其中RBG是由不同的灰度級來描述的。 序列影象:把具有一定聯絡的、具有時間先後關係的影象稱為序列影象。我們經常看到的電視劇或電影影象主要是由序列影象構成的。序列影象是數字多媒體的重要組成部分。序列影象是單幅數字影象在時間軸上的擴充套件,可以將視訊的每一幀視為一幅靜止的影象。

37、取樣/量化/色彩/直方圖 取樣 對連續的2D訊號(影象)進行取樣,將依據預先定義的行數和列數得到一個完整的二維訊號陣列。給定行和列相交處的點(元素)稱為畫素。取樣原始影象是一個有損操作-取樣影象的質量取決於預設的取樣水平。     用不同取樣等級得到的影象 量化 量化等級表示的是在數字影象中,每個畫素的取值範圍.常用的量化等級有2,64,256,1024,4096,16384等等。舉例來說,如果我們使用1024個量化等級,那麼在影象中每個畫素可能的取值就是0~1023中的某個數。     使用不同量化等級得到的影象 色彩 對數字影象來說,最後一個要素是每個畫素的色彩。當前最流行的色彩模型是RGB模型,我們用紅綠藍3個顏色分量來表示任意一種顏色。在RGB模式影象中,每個畫素點包含了其在3個顏色分量下的飽和度。 另一個常用的色彩模型是HSV,HSV模型同樣使用3個分量來表示色彩:色調,飽和度,明度.這個模型可以在顏色空間中表示為一個圓錐形。 在印刷行業,最受歡迎的顏色模式 是CMYK,它包含4種基本顏色:青,品紅,黃,黑,它們互相調和形成最終的顏色.   直方圖 影象直方圖是影象中每種顏色或亮度等級發生次數的統計資訊。直方圖告訴我們很多關於影象的資訊—-不僅限於亮度和對比度。使用直方圖,我們可以判斷影象細節是否已被正確捕獲和儲存。在分析彩色影象時,我們接收每個顏色的直方圖(RGB)。灰度影象則使用單一的直方圖。 彩色和灰度影象的直方圖

38、資料量與資訊量 資料量,就是一張影象佔了多少個位元組,比如1萬個畫素,每個畫素佔1個位元組,那未壓縮前的資料量就是 1萬個位元組。 資訊量,資訊量表示一張圖片裡包含了多少種資訊。假如一張全白的圖片,它只有”白色”這個資訊,那麼它的資訊量就很小,白色畫素出現的概率是1,非常大。這樣的圖片不管它資料量再大,假設是1萬乘1萬的大小,都可以壓縮到很小的程度。假如一張五顏六色的圖片,裡面包含很多不同的顏色資訊,說明它資訊量很大,那麼就很難被壓縮了。

39、影象處理和計算機視覺的分類 關於影象處理,影象分析和計算機視覺的劃分並沒有一個很統一的標準。按照當前流行的分類方法,分為三部分: A.影象處理:對輸入的影象做某種變換,輸出仍然是影象,基本不涉及或者很少涉及影象內容的分析。比較典型的有影象變換,影象增強,影象去噪,影象壓縮,影象恢復,二值影象處理等等。基於閾值的影象分割也屬於影象處理的範疇。一般處理的是單幅影象。 B.影象分析:對影象的內容進行分析,提取有意義的特徵,以便於後續的處理。處理的仍然是單幅影象。 C.計算機視覺:對影象分析得到的特徵進行分析,提取場景的語義表示,讓計算機具有人眼和人腦的能力。這時處理的是多幅影象或者序列影象,當然也包括部分單幅影象。

40、選取相機 相機還應該提供: 相機功能和成像質量。一臺好相機決不只是畫素數高。您還應該考慮到成像質量和相機功能。在評估數字相機的成像質量時,重要因素除解析度外,還包括感光度、動態範圍及 信噪比。就相機功能來說,最重要的功能之一是速度,通常以每秒幀數(fps)來表示。它定義每秒能夠記錄的最大幀數

41、影象內插 影象內插:已知資料來估計未知位置的數值的處理。在放大、縮放、旋轉和幾何校正中廣泛使用,是基本的重取樣方法。 最近鄰內插法:假設一幅影象大小為500×500畫素,將其放大1.5倍到750×750畫素。建立一個假想的750×750的網格,它與原始影象有相同的間隔,然後將收縮,使它準確地與原圖匹配。此時750×750的網格的畫素要小於原影象的畫素間隔,在原影象中尋找最接近的畫素,並把該畫素的灰度賦給750×750網格中的新物件。然後將影象擴充套件到原來規定的大小,得到放大後的影象。這種方法簡單,但可能產生不希望的結果,如直邊緣的嚴重失真。 雙線性內插:用4個最近鄰去估計給定位置的灰度。令(x, y)為想要賦以灰度值的位置的座標,並令v(x, y)表示灰度值,對於雙線性內插來說,賦值公式為: v(x,y)=ax+by+cxy+d 4個係數由4個用(x, y)點最近鄰點寫出的未知方程確定。 雙三次內插:用16個最近鄰點去估計給定位置的灰度。公式如下: v(x,y)=∑i=03∑j=03aijxiyj 當上限為1時,該方程與雙線性內插方法是一致的。雙三次內插是商業影象編輯程式的標準內插方法。 相鄰畫素:位於座標(x, y)處的畫素p有4個水平和垂直的相鄰畫素,其座標由為: (x+1,y),(x−1,y),(x,y+1),(x,y−1) 這組畫素稱為p的4領域(4-neighbors of p),用N4(p)表示。 p的4個對角(diagonal)相鄰畫素座標為: (x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1) 用ND(p)表示。這些點與4個鄰點一起稱為p的8鄰域(8-neighbors of p)。用N8(p)表示。如果(x, y)位於影象的邊界上,某些鄰點會落入影象的外邊。

三、

31、機器視覺基本功能 測量、定位、識別、檢測

32、英寸 1英寸=25.4 mm 但是在CCD中間1英寸=16mm 比如:CCD尺寸1/3”: 指CCD對角線長度為1/3英寸。 說明:這是歷史問題導致的,那時早期的電視攝像機使用的感光元件是真空管,現在常見的CCD和CMOS感測器,那時候還沒發明出來呢。真空管的外面是有個玻璃罩子的,真空管外徑是把玻璃厚度也算進去的。玻璃管當然是不能用於成像的,所以外徑1英寸的真空管,實際成像區域只有16mm左右,於是16mm就成了電子攝像照相行業一個約定俗成的度量單位。 雖然真空管成像技術現在已經不使用了,但是這種度量方式卻被一直繼承了下來。 所以現在數碼成像元件中提到英寸這個單位,都不能按工業標準的1英=25.4mm來計算,而要按1英寸=16mm來計算。

33、數字影象處理 數字影象處理(Digital Image Processing)是通過計算機對影象進行去除噪聲、增強、復原、分割、提取特徵等處理的方法和技術。又稱為計算機影象處理,它是指將影象訊號轉換成數字訊號並利用計算機對其進行處理的過程。 主要目的: (1)提高影象的視感質量,如進行影象的亮度、彩色變換,增強、抑制某些成分,對影象進行幾何變換等,以改善影象的質量。

(2)提取影象中所包含的某些特徵或特殊資訊,提取特徵或資訊的過程是模式識別或計算機視覺的預處理。

(3)影象資料的變換、編碼和壓縮,以便於影象的儲存和傳輸。

常用方法:

1)影象變換:由於影象陣列很大,直接在空間域中進行處理,涉及計算量很大。如傅立葉變換、沃爾什變換、離散餘弦變換等間接處理技術,將空間域的處理轉換為變換域處理。

2 )影象編碼壓縮:影象編碼壓縮技術可減少描述影象的資料量,以便節省影象傳輸、處理時間和減少所佔用的儲存器容量。

3 )影象增強和復原:影象增強和復原的目的是為了提高影象的質量,如去除噪聲,提高影象的清晰度等。

4 )影象分割,將影象中有意義的特徵部分提取出來,其有意義的特徵有影象中的邊緣、區域等,這是進一步進行影象識別、分析和理解的基礎。

5 )影象描述,作為最簡單的二值影象可採用其幾何特性描述物體的特性,一般影象的描述方法採用二維形狀描述。

6 )影象分類(識別),其主要內容是影象經過某些預處理(增強、復原、壓縮)後,進行影象分割和特徵提取,從而進行判決分類。 基本特點:處理資訊量很大、佔用頻帶較寬、各畫素相關性大、無法復現全部資訊、受人的因素影響較大,看完百度百科的精簡總結。

34、模擬/數字影象 又稱連續影象,是指在二維座標系中連續變化的影象,即影象的像點是無限稠密的,同時具有灰度值(即影象從暗到亮的變化值)。連續影象的典型代表是由光學透鏡系統獲取的影象,如人物照片和景物照片等,有時又稱模擬影象。 模擬影象是通過某種物理量的強弱變化來表現影象上各個點的顏色資訊的,印刷品影象、相片、畫稿上的影象都是模擬影象。模擬圖象是連續的點組成。 數字影象:數字影象,是以二維數字組形式表示的影象,其數字單元為像元,數字影象的恰當應用通常需要數字影象與看到的現象之間關係的知識,也就是幾何和光度學或者感測器校準,數字影象處理領域就是研究它們的變換演算法。數字影象,又稱數碼影象或數點陣圖像,是二維影象用有限數字數值畫素的表示。由陣列或矩陣表示,其光照位置和強度都是離散的。數字影象是由模擬影象數字化得到的、以畫素為基本元素的、可以用數字計算機或數位電路儲存和處理的影象。

35、畫素/解析度/深度等 畫素:由一個數字序列表示的影象中的一個最小單位。可以理解為一個二維陣列的一個元素,其值大小表示灰度(強度) 灰度:灰度是表明影象明暗的數值,即黑白影象中點的顏色深度,範圍一般從0到255,白色為255 ,黑色為0,故黑白圖片也稱灰度影象。灰度值指的是單個畫素點的亮度。灰度值越大表示越亮。 動態範圍:系統中最大可度量灰度與最小可檢測灰度之比。上限取決於飽和度,下限取決於噪聲。 對比度:一幅影象中最高和最低灰度級間的灰度差。高動態範圍意味著高對比度。 灰度級:灰度級表明影象中不同灰度的最大數量。灰度級越大,影象的亮度範圍越大。 影象/空間解析度:單位距離可分辨的最大線對數量/畫素數。 灰度解析度:灰度級中可分辨的最小變化。通常說一副被量化為256級的影象有8位元的灰度解析度。 螢幕解析度:螢幕解析度是螢幕每行的畫素點數*每列的畫素點數,每個螢幕有自己的解析度。螢幕解析度越高,所呈現的色彩越多,清晰度越高。 影象所需要的位數b:b=MxNxK MxN是空間解析度,K灰度解析度,單位是bit。 影象深度:是指儲存每個畫素所用的位數,也用於量度影象的色彩解析度。影象深度確定彩色影象的每個畫素可能有的顏色[數,或者確定灰度影象的每個畫素可能有的灰度級數.它決定了彩色影象中可出現的最多顏色數,或灰度影象中的最大灰度等級。比如一幅單色影象,若每個畫素有8位 ,則最大灰度數目為2的8次方,即256。一幅彩色影象RGB3個分量的畫素位數分別為4,4,2,則最大顏色數目為2的4+4+2次方,即1024,就是說畫素的深度為10位,每個畫素可以是1024種顏色中的一種。 影象取樣:對影象空間座標的離散化,它決定了影象的空間解析度。取樣的實質就是要用多少點來描述一幅影象,取樣結果質量的高低就是用前面所說的影象解析度來衡量。簡單來講,對二維空間上連續的影象在水平和垂直方向上等間距地分割成矩形網狀結構,所形成的微小方格稱為畫素點。一副影象就被取樣成有限個畫素點構成的集合。例如:一副640*480解析度的影象,表示這幅影象是由640*480=307200個畫素點組成。 點陣圖:也稱點陣圖,它是由許多點組成的,這些點稱為畫素。當許多不同顏色的點組合在一起後,便構成了一副完整的影象。 點陣圖可以記錄每一個點的資料資訊,從而精確地製作色彩和色調變化豐富的影象。但是,由於點陣圖影象與解析度有關,它所包含的影象畫素數目是一定的,若將影象放大到一定程度後,影象就會失真,邊緣出現鋸齒。 深度:深度即位數(位元數)①位深:一個畫素點所佔的總位數,也叫畫素深度、影象深度等,其中位深 = 通道數 × 每個通道所佔位數 ②256色圖:n位的畫素點可以表示2^n種顏色,稱2^n色圖,n=8時為256色圖 ③8位RGB與8點陣圖:前者的位數指每個通道所佔的位數,後者指整個畫素點共佔的位數,其中8位RGB是一個24點陣圖,也稱為真彩。 對比度:指不同顏色之間的差別。對比度越大,不同顏色之間的反差越大,即所謂黑白分明,對比度過大,影象就會顯得很刺眼。對比度越小,不同顏色之間的反差就越小。對比度=最大灰度值/最小灰度值。 亮度:指照射在景物或影象上光線的明暗程度。影象亮度增加時,就會顯得耀眼或刺眼,亮度越小時,影象就會顯得灰暗。 頻率:灰度值變化劇烈程度的指標,是灰度在平面空間上的梯度。低頻就是顏色緩慢地變化,也就是灰度緩慢地變化,就代表著那是連續漸變的一塊區域,這部分就是低頻。 高頻就是頻率變化快,即相鄰區域之間灰度相差很大,這就是變化得快。影象中,一個影像與背景的邊緣部位的頻率高,即高頻顯示影象邊緣。影象的細節處也是屬於灰度值急劇變化的區域,正是因為灰度值的急劇變化,才會出現細節。另外噪聲(即噪點)也是這樣,在一個畫素所在的位置,之所以是噪點,就是因為它與正常的點顏色不一樣了,灰度有了快速地變化。固有“影象的低頻是輪廓,高頻是噪聲和細節”。 空域:也叫空間域,即所說的畫素域,在空域的處理就是在畫素級的處理,如在畫素級的影象疊加。通過傅立葉變換後,得到的是影象的頻譜。表示影象的能量梯度。 頻域: 也叫頻率域,任何一個波形都可以分解成多個正弦波之和。每個正弦波都有自己的頻率和振幅。所以任意一個波形訊號有自己的頻率和振幅的集合。頻率域就是空間域經過傅立葉變換的訊號。

36、數字影象型別 黑白影象:影象的每個畫素只能是黑或白,沒有中間的過渡,故又稱為二值影象。二值影象的畫素值只有0.1。 灰度影象:灰度影象是每個畫素的資訊由一個量化的灰度級來描述影象,沒有彩色資訊。 彩色影象:彩色影象是指每個畫素的資訊由RGB三原色構成的影象,其中RBG是由不同的灰度級來描述的。 序列影象:把具有一定聯絡的、具有時間先後關係的影象稱為序列影象。我們經常看到的電視劇或電影影象主要是由序列影象構成的。序列影象是數字多媒體的重要組成部分。序列影象是單幅數字影象在時間軸上的擴充套件,可以將視訊的每一幀視為一幅靜止的影象。

37、取樣/量化/色彩/直方圖 取樣 對連續的2D訊號(影象)進行取樣,將依據預先定義的行數和列數得到一個完整的二維訊號陣列。給定行和列相交處的點(元素)稱為畫素。取樣原始影象是一個有損操作-取樣影象的質量取決於預設的取樣水平。     用不同取樣等級得到的影象 量化 量化等級表示的是在數字影象中,每個畫素的取值範圍.常用的量化等級有2,64,256,1024,4096,16384等等。舉例來說,如果我們使用1024個量化等級,那麼在影象中每個畫素可能的取值就是0~1023中的某個數。     使用不同量化等級得到的影象 色彩 對數字影象來說,最後一個要素是每個畫素的色彩。當前最流行的色彩模型是RGB模型,我們用紅綠藍3個顏色分量來表示任意一種顏色。在RGB模式影象中,每個畫素點包含了其在3個顏色分量下的飽和度。 另一個常用的色彩模型是HSV,HSV模型同樣使用3個分量來表示色彩:色調,飽和度,明度.這個模型可以在顏色空間中表示為一個圓錐形。 在印刷行業,最受歡迎的顏色模式 是CMYK,它包含4種基本顏色:青,品紅,黃,黑,它們互相調和形成最終的顏色.   直方圖 影象直方圖是影象中每種顏色或亮度等級發生次數的統計資訊。直方圖告訴我們很多關於影象的資訊—-不僅限於亮度和對比度。使用直方圖,我們可以判斷影象細節是否已被正確捕獲和儲存。在分析彩色影象時,我們接收每個顏色的直方圖(RGB)。灰度影象則使用單一的直方圖。 彩色和灰度影象的直方圖

38、資料量與資訊量 資料量,就是一張影象佔了多少個位元組,比如1萬個畫素,每個畫素佔1個位元組,那未壓縮前的資料量就是 1萬個位元組。 資訊量,資訊量表示一張圖片裡包含了多少種資訊。假如一張全白的圖片,它只有”白色”這個資訊,那麼它的資訊量就很小,白色畫素出現的概率是1,非常大。這樣的圖片不管它資料量再大,假設是1萬乘1萬的大小,都可以壓縮到很小的程度。假如一張五顏六色的圖片,裡面包含很多不同的顏色資訊,說明它資訊量很大,那麼就很難被壓縮了。

39、影象處理和計算機視覺的分類 關於影象處理,影象分析和計算機視覺的劃分並沒有一個很統一的標準。按照當前流行的分類方法,分為三部分: A.影象處理:對輸入的影象做某種變換,輸出仍然是影象,基本不涉及或者很少涉及影象內容的分析。比較典型的有影象變換,影象增強,影象去噪,影象壓縮,影象恢復,二值影象處理等等。基於閾值的影象分割也屬於影象處理的範疇。一般處理的是單幅影象。 B.影象分析:對影象的內容進行分析,提取有意義的特徵,以便於後續的處理。處理的仍然是單幅影象。 C.計算機視覺:對影象分析得到的特徵進行分析,提取場景的語義表示,讓計算機具有人眼和人腦的能力。這時處理的是多幅影象或者序列影象,當然也包括部分單幅影象。

40、選取相機 相機還應該提供: 相機功能和成像質量。一臺好相機決不只是畫素數高。您還應該考慮到成像質量和相機功能。在評估數字相機的成像質量時,重要因素除解析度外,還包括感光度、動態範圍及 信噪比。就相機功能來說,最重要的功能之一是速度,通常以每秒幀數(fps)來表示。它定義每秒能夠記錄的最大幀數

41、影象內插 影象內插:已知資料來估計未知位置的數值的處理。在放大、縮放、旋轉和幾何校正中廣泛使用,是基本的重取樣方法。 最近鄰內插法:假設一幅影象大小為500×500畫素,將其放大1.5倍到750×750畫素。建立一個假想的750×750的網格,它與原始影象有相同的間隔,然後將收縮,使它準確地與原圖匹配。此時750×750的網格的畫素要小於原影象的畫素間隔,在原影象中尋找最接近的畫素,並把該畫素的灰度賦給750×750網格中的新物件。然後將影象擴充套件到原來規定的大小,得到放大後的影象。這種方法簡單,但可能產生不希望的結果,如直邊緣的嚴重失真。 雙線性內插:用4個最近鄰去估計給定位置的灰度。令(x, y)為想要賦以灰度值的位置的座標,並令v(x, y)表示灰度值,對於雙線性內插來說,賦值公式為: v(x,y)=ax+by+cxy+d 4個係數由4個用(x, y)點最近鄰點寫出的未知方程確定。 雙三次內插:用16個最近鄰點去估計給定位置的灰度。公式如下: v(x,y)=∑i=03∑j=03aijxiyj 當上限為1時,該方程與雙線性內插方法是一致的。雙三次內插是商業影象編輯程式的標準內插方法。 相鄰畫素:位於座標(x, y)處的畫素p有4個水平和垂直的相鄰畫素,其座標由為: (x+1,y),(x−1,y),(x,y+1),(x,y−1) 這組畫素稱為p的4領域(4-neighbors of p),用N4(p)表示。 p的4個對角(diagonal)相鄰畫素座標為: (x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1) 用ND(p)表示。這些點與4個鄰點一起稱為p的8鄰域(8-neighbors of p)。用N8(p)表示。如果(x, y)位於影象的邊界上,某些鄰點會落入影象的外邊。