Caffe學習系列(14):初識資料視覺化
阿新 • • 發佈:2019-01-02
轉載自http://www.cnblogs.com/denny402/p/5092075.html
在jupyter notebook裡
首先將caffe的根目錄作為當前目錄,然後載入caffe程式自帶的小貓圖片,並顯示。
圖片大小為360x480,三通道
In [1]:
import numpy as np import matplotlib.pyplot as plt %matplotlib inline import caffe caffe_root='/home/xxx/caffe/' import os,sys os.chdir(caffe_root) sys.path.insert(0,caffe_root+'python') im = caffe.io.load_image('examples/images/cat.jpg') print im.shape plt.imshow(im) plt.axis('off')
(360, 480, 3)Out[1]:
(-0.5, 479.5, 359.5, -0.5)
開啟examples/net_surgery/conv.prototxt檔案,修改兩個地方
一是將input_shape由原來的是(1,1,100,100)修改為(1,3,100,100),即由單通道灰度圖變為三通道彩色圖。
二是將過濾器個數(num_output)由3修改為16,多增加一些filter, 當然保持原來的數不變也行。
其它地方不變,修改後的prototxt如下:只有一個卷積層
In [2]:! cat examples/net_surgery/conv.prototxt
# Simple single-layer network to showcase editing model parameters. name: "convolution" input: "data" input_shape { dim: 1 dim: 3 dim: 100 dim: 100 } layer { name: "conv" type: "Convolution" bottom: "data" top: "conv" convolution_param { num_output: 16 kernel_size: 5 stride: 1 weight_filler { type: "gaussian" std: 0.01 } bias_filler { type: "constant" value: 0 } } }
將圖片資料載入到blobs,但反過來,我們也可以反過來從blob中提取出原始資料,並進行顯示。
顯示的時候要注意各維的順序,如blobs的順序是(1,3,360,480),從前往後分別表示1張圖片,3三個通道,
圖片大小為360x480,需要呼叫transpose改變為(360,480,3)才能正常顯示。
其中用data[0]表示第一張圖片,下標從0開始,此例只有一張圖片,因此只能是data[0].
分別用data[0,0],data[0,1]和data[0,2]表示該圖片的三個通道。
In [3]:net = caffe.Net('examples/net_surgery/conv.prototxt', caffe.TEST) im_input=im[np.newaxis,:,:,:].transpose(0,3,1,2) print "data-blobs:",im_input.shape net.blobs['data'].reshape(*im_input.shape) net.blobs['data'].data[...] = im_input plt.imshow(net.blobs['data'].data[0].transpose(1,2,0)) plt.axis('off')
data-blobs: (1, 3, 360, 480)Out[3]:
(-0.5, 479.5, 359.5, -0.5)
編寫一個show_data函式來顯示資料
In [4]:plt.rcParams['image.cmap'] = 'gray' def show_data(data,head,padsize=1, padval=0): data -= data.min() data /= data.max() # force the number of filters to be square n = int(np.ceil(np.sqrt(data.shape[0]))) padding = ((0, n ** 2 - data.shape[0]), (0, padsize), (0, padsize)) + ((0, 0),) * (data.ndim - 3) data = np.pad(data, padding, mode='constant', constant_values=(padval, padval)) # tile the filters into an image data = data.reshape((n, n) + data.shape[1:]).transpose((0, 2, 1, 3) + tuple(range(4, data.ndim + 1))) data = data.reshape((n * data.shape[1], n * data.shape[3]) + data.shape[4:]) plt.figure() plt.title(head) plt.imshow(data) plt.axis('off')
從blobs資料中將原始圖片提取出來,並分別顯示不同的通道圖
In [5]:print "data-blobs:",net.blobs['data'].data.shape show_data(net.blobs['data'].data[0],'origin images')
data-blobs: (1, 3, 360, 480)
呼叫forward()執行卷積操作,blobs資料發生改變。由原來的(1,3,360,480)變為(1,16,356,476)。
並初始化生成了相應的權值,權值資料為(16,3,5,5)。
最後呼叫兩次show_data來分別顯示權值和卷積過濾後的16通道圖片。
In [6]:net.forward() print "data-blobs:",net.blobs['data'].data.shape print "conv-blobs:",net.blobs['conv'].data.shape print "weight-blobs:",net.params['conv'][0].data.shape show_data(net.params['conv'][0].data[:,0],'conv weights(filter)') show_data(net.blobs['conv'].data[0],'post-conv images')
data-blobs: (1, 3, 360, 480) conv-blobs: (1, 16, 356, 476) weight-blobs: (16, 3, 5, 5)