python計算機視覺深度學習工具2影象基礎
構建自己的影象分類器之前需要了解影象是什麼。
畫素:影象的元素
畫素是影象的基本元素。每個影象都由一組畫素組成。沒有比畫素更細的粒度。
通常畫素是光的“顏色”或“強度”。
下圖的解析度為1,000×750,這意味著它是1,000畫素寬750畫素高。我們可以將影象概念化為(多維)矩陣。圖片中總共有1,000×750 = 750,000畫素。

image.png
大多數畫素以兩種方式表示:
1.灰度/單通道
2.顏色
在灰度影象中,每個畫素是0到255之間的標量值,其中零對應為“黑色”,255為“白色”。

image.png
彩色畫素通常在RGB顏色空間中表示(其他顏色空間通常要轉成RGB)。

image.png
黑色:(0, 0, 0)
紅色:(255, 0, 0)
RGB色彩空間的主要缺點包括:
•不使用“顏色選擇器”工具時表示顏色不直觀
•它不像人類看待顏色的方式。

image.png

image.png
影象座標系統
OpenCV和scikit-image用多維NumPy陣列表示RGB。

image.png
import cv2 image = cv2.imread("example.png") print(image.shape) cv2.imshow("Image", image) cv2.waitKey(0)
執行結果:
$ python load_display.py (248, 300, 3)
畫素訪問
(b, g, r) = image[20, 100] # accesses pixel at x=100, y=20 (b, g, r) = image[75, 25] # accesses pixel at x=25, y=75 (b, g, r) = image[90, 85] # accesses pixel at x=85, y=90
OpenCV的儲存順序:Blue, Green, Red
- 技術支援qq群144081101591302926 567351477 釘釘免費群:21745728
縮放

image.png
多數神經網路和卷積神經網路應用於影象任務分類要求固定大小的輸入,意味著你通過的所有影象的尺寸必須相同。輸入的寬度和高度影象尺寸的常見選擇卷積神經網路包括32×32,64×64,224×224,227×227,256×256和299×299。

image.png