python影象處理之scikit-image基本用法

阿新 • • 發佈：2019-02-02

本文介紹Python語言用於數字影象處理，那麼要使用python進行各種開發和科學計算，需要對應相對的python包，

python有很多的數字影象處理相關的包，像

PIL
Pillow
OpenCV
scikit-image
等等

其中PIL和Pillow只提供最基礎的數字影象處理，功能有限；

opencv實際上是一個c++庫，只是提供了python介面，

scikit-image是基於scipy的一款影象處理包，它將圖片作為numpy陣列進行處理，正好與matlab一樣，因此，我們最終選擇scikit-image進行數字影象處理。

python庫安裝

可以通過pip進行安裝

sudo pip install xxxx

scikit-image是基於numpy，因此需要安裝numpy和scipy，同時需要安裝matplotlib進行圖片的實現等。

因此，需要安裝如下的包：

numpy (1.13.3)
matplotlib (2.1.0)
scikit-image (0.13.1)
scipy (1.0.0)

也可以直接下載整合開發環境Anaconda,該環境已經集成了數字影象處理相關的包，因此安裝起來比較方便。

可以通過如下程式簡單測試下相關庫是否安裝成功

import numpy as np
import scipy as sp
import 
 matplotlib.pyplot as plt
from skimage import io

img = io.imread("./cat.png")
print(img.shape)

plt.imshow(img)
plt.show()

若顯示正常，則可以認為相關的庫安裝成功

skimage庫子模組介紹

skimage庫的全稱scikit-image Scikit，是對scipy.ndimage進行了擴充套件，提供了更多的圖片處理功能。skimage包含很多的子模組，各個子模組具有不同的功能，如下

子模組名稱	實現功能
io	讀取,儲存和顯示圖片和視訊
color	顏色空間變換
data	提供一些測試圖片和樣本資料
filters	影象增強，邊緣檢測，排序濾波器，自動閾值等
draw	操作於numpy陣列上的基本圖形繪製，包括線條，矩陣，圓和文字等
transform	幾何變換和其他變換，如旋轉，拉伸和Radon(拉東)變換等
exposure	影象強度調整，例如，直方圖均衡化等
feature	特徵檢測和提取，例如，紋理分析等
graph	圖論操作，例如，最短路徑
measure	影象屬性測量，例如，相似度和輪廓
morphology	形態學操作，如開閉運算，骨架提取等
novice	簡化的用於教學目的的介面
restoration	修復演算法，例如去卷積演算法，去噪等
segmentation	影象分割為多個區域
util	通用工具
viewer	簡單圖形使用者介面用於視覺化結果和探索引數

當要使用對應的模組中功能函式時，需要通過import匯入對應的子模組即可, 若要匯入多個子模組時，子模組之間用逗號隔開，如下：

from skimage import io, data, feature

skimage操作

影象讀取, 儲存與顯示

skimage中io子模組提供了相關的功能，同時也提供了一些data模組，其中包含一些示例圖片用於練習

匯入io子模組的python語句如下:

from skimage import io

從外部讀取圖片並顯示

使用 skimage.io.imread(fname) 讀取fname指定的圖片，

skimage.io.imshow(arr)，表示顯示arr陣列表示的圖片

from skimage import io
img = io.imread('./cat.png')
io.imshow(img)
io.show()

讀取單張灰度圖片時，使用 skimage.io.imread(fname, as_grey=True) 函式，第一個引數fname表示要顯示的圖片路徑，第二個引數as_grey，是bool型別，預設值False。

from skimage import io
img = io.imread('./cat.png', as_grey=True)
io.imshow(img)
io.show()

skimage自帶圖片

圖片名稱	說明
astronaut	宇航員
binary_blobs	二元斑點
camera	相機
checkerboard	棋盤
chelsea	貓
clock	時鐘
coffee	一杯咖啡
coins	硬幣
horse	馬
hubble_deep_field	星空
immunohistochemistry	結腸圖片
logo	商標
moon	月球表面
page	書頁內容
rocket	火箭
text	文字圖片

例如

from skimage import io, data
img = data.hubble_deep_field()
io.imshow(img)
io.show()

圖片名就是對應的函式名，如camera圖片對應的函式名為 data.camera()。

注：這些圖片儲存在skimage的安裝目錄下，可以通過data_dir把路徑打印出來。

from skimage import data_dir
print (data_dir)

輸出為：

/usr/local/lib/python3.6/dist-packages/skimage/data

儲存圖片

使用 io.imsave(fname, arr) 函式進行儲存,

引數fname: 表示儲存的路徑和名稱
引數arr：表示需要儲存的陣列變數

from skimage import io, data

img = data.checkerboard()
io.imshow(img)
io.imsave('checkerboard_copy.jpg', img)

這樣，在當前的工作目錄下就增加了一個checkerboard_copy.jpg檔案。

注：儲存圖片同時也起到了轉換格式的作用，若讀取的是png格式圖片，當儲存為jpg時，則圖片從png格式轉換為jpg格式圖片。

獲取圖片資訊

from skimage import io, data

img = data.chelsea()
io.imshow(img)
io.show()

print(type(img))    # 型別
print(img.shape)    # 形狀
print(img.shape[0]) # 圖片寬度
print(img.shape[1]) # 圖片高度
print(img.shape[2]) # 圖片通道數
print(img.size)     # 顯示總畫素個數
print(img.max())    # 最大畫素值
print(img.min())    # 最小畫素值
print(img.mean())   # 畫素平均值

輸出如下

影象畫素訪問與裁剪

圖片讀入程式後，以numpy陣列方式儲存，因此對numpy陣列的操作，都可以用於圖片陣列，對陣列元素的訪問，實際上就是對圖片畫素點的訪問。

畫素讀取

對 彩色圖片 的畫素點訪問方式如下

img[i, j, c]

其中：

i 表示圖片的行數
j 表示圖片的列數
c 表示圖片的通道數(RGB三通道分別對應0, 1, 2)。

座標從左上角開始

對 灰度圖片 的畫素點訪問方式如下

gray[i, j]

例如，對data中宇航員圖片的B通道中的第20行10列的畫素值

from skimage import io, data

img = data.astronaut()
pixel = img[20, 10, 2]
print(pixel)

輸出

例如，顯示紅色單通道圖片的程式如下

from skimage import io, data

img = data.astronaut()
R = img[:, :, 0]
io.imshow(R)
io.show()

輸出為：

畫素修改

例如，對宇航員圖片隨機新增椒鹽噪聲

from skimage import io, data
import numpy as np

img = data.astronaut()

# 隨機生成5000個椒鹽點
rows, cols, dims = img.shape

for i in range(5000):
    x = np.random.randint(0, rows)
    y = np.random.randint(0, cols)
    img[x, y, :] = 255

io.imshow(img)
io.show()

輸出如下：

此處，使用numpy中的random來產生隨機數， randint(0, cols)表示隨機生成一個整數，範圍在0到cols之間。

圖片裁剪

由於圖片是以numpy陣列進行儲存，因此對於陣列的裁剪，就是對圖片的裁剪

例如，對宇航員圖片進行裁剪

from skimage import io, data

img = data.astronaut()
partial_img = img[50:150, 170:270, :]
io.imshow(partial_img)
io.show()

輸出結果為:

對多個畫素點進行操作時，使用陣列切片方式進行訪問，切片方式訪問的是指定間隔內下標對應的畫素點。以下是一些例子

img[i,:] = im[j,:]      # 將第 j 行的數值賦值給第 i 行

img[:,i] = 100          # 將第 i 列的所有數值設為 100

img[:100,:50].sum()     # 計算前 100 行、前 50 列所有數值的和

img[50:100,50:100]      # 50~100 行，50~100 列（不包括第 100 行和第 100 列）

img[i].mean()           # 第 i 行所有數值的平均值

img[:,-1]               # 最後一列

img[-2,:] (or im[-2])   # 倒數第二行

以下是兩個對圖片的畫素值進行訪問和修改的例子

例1：將宇航員圖片進行二值化，畫素值大於128的變為1, 否在變為0

from skimage import io, data, color

img = data.astronaut()

img_gray = color.rgb2gray(img)
rows, cols = img_gray.shape

for i in range(rows):
    for j in range(cols):
        if (img_gray[i, j] <= 0.5):
            img_gray[i, j] = 0
        else:
            img_gray[i, j] = 1
io.imshow(img_gray)
io.show()

例2：使用color模組的rgb2gray()函式，將彩色三通道圖片轉換為灰度圖片，轉換結果為float64型別的陣列，範圍在[0,1]之間

from skimage import io, data

img = data.astronaut()

img_idx_modified = img[:, :, 0] > 170
print(img_idx_modified)
img[img_idx_modified] = [0, 255, 0]

io.imshow(img)
io.show()

輸出為

這個例子先對R通道的所有畫素值進行判斷，如果大於170，則將這個地方的畫素值變為[0,255,0], 即G通道值為255，R和B通道值為0。

影象資料型別以及顏色空間轉換

影象資料型別

在skimage中，一張圖片以numpy陣列形式儲存，陣列的資料型別有很多中，相互之間可以轉換，資料型別以及取值範圍如下表所示

資料型別	數值範圍
uint8	0 to 255
uint16	0 to 65535
uint32	0 to 232−1232−1
float16	半精度浮點數：16位，正負號1位，指數5位，精度10位
float32	單精度浮點數：32位，正負號1位，指數8位，精度23位
float64	雙精度浮點數：64位，正負號1位，指數11位，精度52位
float	-1 to 1 or 0 to 1
int8	-128 to 127
int16	-32768 to 32767
int32	−231−231 to 232−1232−1

一張圖片的畫素值範圍是[0,255], 因此預設型別是unit8, 可用如下程式碼檢視資料型別：

from skimage import io, data

img = data.astronaut()

print(img.dtype.name)

輸出

uint8

在上面的表中，特別注意的是float型別，它的範圍是[-1,1]或[0,1]之間。一張彩色圖片轉換為灰度圖後，它的型別就由unit8變成了float

uint8轉為float

from skimage import data, img_as_float

img = data.astronaut()
print(img.dtype.name)

dst = img_as_float(img)
print(dst.dtype.name)
dst

輸出為

uint8
float64

float轉為uint8

from skimage import img_as_ubyte
import numpy as np

img = np.array([0, 0.5, 1], dtype=float)
print(img.dtype.name)

dst = img_as_ubyte(img)
print(dst.dtype.name)

輸出為：

float64
uint8

float轉為uint8,可能會造成資料損失，因此會有警告

除了如上兩種轉換以外，還有其他的一些型別轉換，如下表:

函式名	描述
img_as_float	Convert to 64-bit floating point
img_as_ubyte	Convert to 8-bit uint
img_as_uint	Convert to 16-bit uint
img_as_int	Convert to 16-bit int

顏色空間及轉換

除了直接轉換可以改變資料型別外，還可以通過影象的顏色空間轉換來改變資料型別。

常用的顏色空間有灰度空間、rgb空間、hsv空間和cmyk空間。顏色空間轉換以後，圖片型別都變成了float型。

所有的顏色空間轉換函式，都放在skimage的color模組內

例1： RGB轉為灰度圖

from skimage import io,data,color
img=data.camera()
gray=color.rgb2gray(img)
io.imshow(gray)
io.show()

其它的轉換，用法都是一樣的，列舉常用的如下：

skimage.color.rgb2grey(rgb)

skimage.color.rgb2hsv(rgb)

skimage.color.rgb2lab(rgb)

skimage.color.gray2rgb(image)

skimage.color.hsv2rgb(hsv)

skimage.color.lab2rgb(lab)

實際上，上面的所有轉換函式，都可以用一個函式來代替

skimage.color.convert_colorspace(arr, fromspace, tospace)

表示將arr從fromspace顏色空間轉換到tospace顏色空間。

例1： RGB轉為HSV

from skimage import io, data, color

img = data.coffee()
hsv = color.convert_colorspace(img, 'RGB', 'HSV')
io.imshow(hsv)
io.show()

輸出為

在color模組的顏色空間轉換函式中，還有一個比較有用的函式是

skimage.color.label2rgb(arr), 可以根據標籤值對圖片進行著色。以後的圖片分類後著色就可以用這個函式。

例：將coffee圖片分成三類，然後用預設顏色對三類進行著色

from skimage import io,data,color
import numpy as np

img=data.coffee()
gray=color.rgb2gray(img)
rows,cols=gray.shape

labels=np.zeros([rows,cols])
for i in range(rows):
    for j in range(cols):
        if(gray[i,j]<0.4):
            labels[i,j]=0
        elif(gray[i,j]<0.75):
            labels[i,j]=1
        else:
            labels[i,j]=2
dst=color.label2rgb(labels)

io.imshow(dst)
io.show()

參考

python影象處理之scikit-image基本用法

本文介紹Python語言用於數字影象處理，那麼要使用python進行各種開發和科學計算，需要對應相對的python包， python有很多的數字影象處理相關的包，像 PIL Pillow OpenCV scikit-image 等等其中PIL和Pil

Python影象處理之圖片文字識別（OCR）

OCR與Tesseract介紹將圖片翻譯成文字一般被稱為光學文字識別（Optical Character Recognition，OCR）。可以實現OCR 的底層庫並不多，目前很多庫都是使用共同的幾個底層OCR 庫，或者是在上面進行定製。 Tess

Python影象處理之Pillow--ImageFilter

ImageFilter:Python中的影象濾波，主要對影象進行平滑、銳化、邊界增強等濾波處理。影象濾波：在儘量保留影象細節特徵的條件下對目標影象的噪聲進行抑制，是影象預處理中不可缺少的操作，其處理效果的好壞將直接影響到後續影象處理和分析的有效性和可靠性。存在目的：由於

python&圖片處理之PIL.Image模組(icon圖示)

2.解壓後，進入到目錄下cd /Users/jianan/Downloads/Imaging-1.1.73.python setup.py install 安裝在/Library/Python/2.7

影象處理之PIL.Image與numpy.array之間的相互轉換

當使用PIL.Image.open()開啟圖片後，如果要使用img.shape函式，需要先將image形式轉換成array陣列img = numpy.array(im)比如要加椒鹽噪聲 for k in range(n): i = int(numpy.r

轉載-Python影象處理之圖片文字識別（OCR）

點選開啟連結 segmentFault_jclian91_Python影象處理之圖片文字識別（OCR）OCR與Tesseract介紹將圖片翻譯成文字一般被稱為光學文字識別（Optical Character Recognition，OCR）。可以實現OCR 的底層庫並

Python影象處理庫PIL的基本概念介紹

這一節我們介紹一下PIL中的基本概念。 PIL中所涉及的基本概念有如下幾個：通道（bands）、模式（mode）、尺寸（size）、座標系統（coordinate system）、調色盤（palet

Python影象處理庫PIL的基本概念介紹(一）

Python 的數字影象處理都是基於PIL庫開展的一系列操作所以有些基本概念我們需要清楚 PIL中所涉及的基本概念有如下幾個：通道（bands）、模式（mode）、尺寸（size）、座標系統（coordinate system）、調色盤（palette）、資

Python影象處理之圖片驗證碼識別

在上一篇部落格Python影象處理之圖片文字識別（OCR）中我們介紹了在Python中如何利用Tesseract軟體來識別圖片中的英文與中文，本文將具體介紹如何在Python中利用Tesseract軟體來識別驗證碼（數字加字母）。我們在網上瀏覽網頁或

Python影象處理之邊緣檢測

在影象識別中，需要有邊緣鮮明的影象，即影象銳化。影象銳化的目的是為了突出影象的邊緣資訊，加強影象的輪廓特徵，以便於人眼的觀察和機器識別。在空間域進行影象銳化主要有以下幾種方法： 1、梯度運算元影象的邊緣最直觀的表現就是邊緣兩側的灰度值相差比較大，在微積

python影象處理---python的影象處理模組Image-

【python影象處理】python的影象處理模組Image 版本資訊：2.7.11 環境：windows 7 64位系統編輯器：PyCharm 執行工具：PyCharm 檔案地址：D:\phpStudy\WWW\python\Image 一、引入影象模組

[Python影象處理] 十.形態學之影象頂帽運算和黑帽運算

該系列文章是講解Python OpenCV影象處理知識，前期主要講解影象入門、OpenCV基礎用法，中期講解影象處理的各種演算法，包括影象銳化運算元、影象增強技術、影象分割等，後期結合深度學習研究影象識別、影象分類應用。希望文章對您有所幫助，如果有不足之處，還請海涵~ 同時推薦作者的

[Python影象處理] 九.形態學之影象開運算、閉運算、梯度運算

影象處理之影象基本變化（平移、縮放、旋轉）（Octave實現）

在模式識別及計算機視覺中，要經常進行影象的變化。例如：在識別手寫數字中，我們可能在廣泛應用中要求所有的圖片都是20*20這麼好的規格。所以，我們就需要進行縮放來達到目的。今天來總結下學到的影象的基本變換。首先我們計 (w,v) (w,v)為源影象的

Python資料處理之（十）Pandas 基本介紹

一、Numpy 和 Pandas 有什麼不同如果用 python 的列表和字典來作比較, 那麼可以說 Numpy 是列表形式的，沒有數值標籤，而 Pandas 就是字典形式。Pandas是基於Numpy構建的，讓Numpy為中心的應用變得更加簡單。要使用pandas，首先需要

Python影象處理庫PIL的Image模組介紹（四）

（Image模組方法16-25） 16、 Paste 定義1：im.paste(image,box) 含義1：將一張圖貼上到另一張影象上。變數box或者是一個給定左上角的2元組，或者是定義了左，上，右和下畫素座標的4元組，或者為空（與（0，0）一樣）。如果給定4元組，

影象處理之python(基礎學習)

影象的基本處理 1. 讀取圖片 2. 儲存圖片 3. 顏色空間轉換 4. 獲取圖片屬性 5. 縮放圖片 6. 平移圖片 7. 旋轉圖片 8. 仿射變換 9. 通道的拆分/合併

[Python影象處理] 四.影象平滑之均值濾波、方框濾波、高斯濾波及中值濾波

該系列文章是講解Python OpenCV影象處理知識，前期主要講解影象入門、OpenCV基礎用法，中期講解影象處理的各種演算法，包括影象銳化運算元、影象增強技術、影象分割等，後期結合深度學習研究影象識別、影象分類應用。希望文章對您有所幫助，如果有不足之處，還請

Python: 影象處理的基本運算

Python 作為一種面向物件、直譯式的計算機程式語言，在很多領域得到廣泛應用。本文主要介紹 Python 在影象處理中的基本運算，藉助 scikit-image 庫，Python 在做影象處理的

OpenCv-Python 影象處理基本操作

1. 圖片載入、顯示和儲存import cv2 img = cv2.imread("01.jpg") imgGrey = cv2.imread("01.jpg",0) cv2.imshow("img"

python影象處理之scikit-image基本用法

python庫安裝

skimage庫子模組介紹

skimage操作

影象讀取, 儲存與顯示

從外部讀取圖片並顯示

skimage自帶圖片

儲存圖片

獲取圖片資訊

影象畫素訪問與裁剪

畫素讀取

畫素修改

圖片裁剪

影象資料型別以及顏色空間轉換

影象資料型別

顏色空間及轉換

參考

相關推薦