1. 程式人生 > >Pytorch讀取,加載圖像數據(一)

Pytorch讀取,加載圖像數據(一)

https file 系統 喜歡 準備 load 自己的 作用 文件的

在學習Pytorch的時候,先學會如何正確創建或者加載數據,至關重要。

有了數據,很多函數,操作的效果就變得很直觀。

本文主要用其他庫讀取圖像文件(學會這個,你就可以在之後的學習中,將一些效果直觀化)

更好的文章組織結構:

  • Github

  • 關註公眾號:tuduisuinian(土堆碎念),菜單底部可以獲取pytorch教程PDF文檔

零:準備

加載數據前,需要掌握正確的讀取路徑方法。很多教程中的例子,在講解的時候,沒有提供圖片,或者讀者不知道修改教程中的讀取路徑,打擊了熱情。

建議:為了保證大家可以跟著教程一步一步練習,教程中會出現示例圖片,建議大家右鍵-另存為圖片,將圖片保存到 你運行程序的文件夾 中。

如下圖:

技術分享圖片

壹:數據集的準備

任務:我們用不同的方式讀取這兩張圖片(記得右鍵-另存為圖片,保存到程序所在位置,記得文件重命名為你喜歡的方式,我的重命名為002.jpg003.jpg

技術分享圖片

技術分享圖片

將文件另存為後,同時新建一個python文件,我的效果如下:

技術分享圖片

接下來,我們就可以在load_images.py中,進行相關操作了。

貳:用其他庫讀取圖像文件

  • 使用matplotlib庫進行圖像的讀取

matplotlib中的函數跟Matlab很像。

我們需要使用matplotlib.pyplot中的函數:

imread(文件地址):進行讀取圖像的操作(參數為讀取圖像文件的路徑)

imshow(數組):進行圖像的顯示操作(顯示圖像的數組)

show():顯示一個窗口,用於顯示圖像(很多時候,不顯示圖像的話,是忘記使用這個函數)

我們嘗試探討,圖像被讀取後的數據類型,大小形狀

import matplotlib.pyplot as plt

img = plt.imread(‘002.jpg‘)
#圖片的高H為460,寬W為346,顏色通道C為3
print(img.shape)
print(img.dtype)
print(type(img))
plt.imshow(img)
plt.show()

輸出為:

(460, 346, 3)
uint8
<class ‘numpy.ndarray‘>

結論:imread讀取的圖片為numpy.ndarry

的數組,數組的大小排列為:高×寬×通道數,數組的數據類型是uint8,即每個數據的大小為[0,255]

如果不想手動進行多圖像的讀取,需要使用到Python的文件,路徑操作等。暫不介紹

手動添加的話,就是用[array1,array2]這種形式,將數組進行連接

import matplotlib.pyplot as plt

img1 = plt.imread(‘002.jpg‘)
img2 = plt.imread(‘003.jpg‘)
img = [img1, img2]
for i in img:
    plt.imshow(i)
    plt.show()

  • 使用cv2進行圖像的讀取

cv2庫中,需要用到的函數有:

imread(文件地址):讀取地址處的文件圖像

imshow(‘窗口名稱‘, 圖像數組):將圖像數組顯示出來,但必須結合waitKey()使用,否則無法顯示圖像

waitKey(延遲時間):需要設置延遲時間,當延遲時間≤0時,窗口將會一直延遲,延遲無窮長時間,按下任一按鍵,可以繼續執行下面程序。當延遲時間>0,即窗口圖像會顯示對應毫秒後,自動消失。

import cv2
img1 = cv2.imread(‘002.jpg‘)
print(img1.shape)
print(img1.dtype)
print(type(img1))
cv2.imshow(‘img‘, img1)
cv2.waitKey(0)

輸出為:

(460, 346, 3)
uint8
<class ‘numpy.ndarray‘>

結論:imread讀取的圖片為numpy.ndarry的數組,數組的大小排列為:高×寬×通道數,數組的數據類型是uint8`,即每個數據的大小為[0,255]

Matplotlib與cv2對圖像的數據格式的處理是相似的,但是也是有區別的:

對於通道的讀取,cv2是按BGR的順序讀入,而matplotlib按RGB的順序讀入


  • 使用PIL庫進行圖像處理

PIL全稱為Python Image Library。是給Python提供圖像處理相關的庫。

需要使用到的函數:

open(文件地址):打開文件,註意是打開,並沒有讀取。主要作用是保持檢查文件地址,同時保證文件是打開的狀態。當對圖像處理的時候,會自動加載。

show():使用系統自帶的圖像查看器,查看圖像

from PIL import Image
img1 = Image.open(‘002.jpg‘)
# 因為PIL有自己的數據結構,所以沒有shape,dtype屬性
# print(img1.shape)
# print(img1.dtype)
print(type(img1))
img1.show()

輸出為:

<class ‘PIL.JpegImagePlugin.JpegImageFile‘>

我們可以使用numpy.array()函數,將PIL結構的數據轉換成numpy數組。

import matplotlib.pyplot as plt
from PIL import Image
import numpy as np

img1 = Image.open(‘002.jpg‘)
img1 = np.array(img1)
print(img1.shape)
print(img1.dtype)
plt.imshow(img1)
plt.show()

輸出:

(460, 346, 3)
uint8

可以看到,PIL轉換成numpy後,數據類型是uint8的。


叁:總結

主要介紹了使用matplotlib,cv2,PIL庫進行圖像文件的讀取

  • matplotlib中的imread,imshow,show函數
  • cv2中的imread,imshow,waitKey函數
  • PIL中的open,show函數

Pytorch讀取,加載圖像數據(一)