Caffe原始碼解讀（九）：Caffe視覺化工具

阿新 • • 發佈：2019-01-07

從網路結構視覺化、caffemodel的視覺化、特徵圖視覺化、視覺化loss和accurary曲線等四個方面講視覺化

網路結構視覺化

有兩種辦法：draw_net.py工具和線上視覺化工具，推薦後者，靈活簡便。

1、使用draw_net.py工具

需要安裝numpy、gfortran、graphviz、pydot等工具之後，才能執行draw_net.py。

sudo apt-get update
sudo apt-get install python-pip python-dev python-numpy
sudo apt-get install gfortran graphviz
sudo pip install -r 
 ${CAFFE_ROOT}/python/erquirements.txt
sudo pip install pydot

執行無引數的draw_net.py可以看到他支援的引數選項:

usage: draw_net.py [-h] [--rankdir RANKDIR] [--phase PHASE]
                   input_net_proto_file output_image_file

–rankdir：表示圖的方向，從上往下或者從左往右，預設從左往右
執行命令：

./draw_net.py --rankdir TB ./lenet_train_test.prototxt 
 mnist.png

TB：是top和bottom的縮寫，表示從上往下
執行結果儲存在mnist.png，如圖：
這裡寫圖片描述

2、線上視覺化工具

caffemodel的視覺化

對卷積層而言如果能夠視覺化，就能預先判斷模型的好壞。卷積層的權值視覺化程式碼如下：

# -*- coding: utf-8 -*-
# file:test_extract_weights.py

import numpy as np
import matplotlib.pyplot as plt
import os
import sys
import caffe

deploy_file = "./mnist_deploy.prototxt" 

model_file  = "./lenet_iter_10000.caffemodel"

#編寫一個函式，用於顯示各層的引數,padsize用於設定圖片間隔空隙,padval用於調整亮度 
def show_weight(data, padsize=1, padval=0):
    #歸一化
    data -= data.min()
    data /= data.max()

    #根據data中圖片數量data.shape[0]，計算最後輸出時每行每列圖片數n
    n = int(np.ceil(np.sqrt(data.shape[0])))
    print "The number of pic in one line or collum:",n
    # padding = ((圖片個數維度的padding),(圖片高的padding), (圖片寬的padding), ....)
    print "data.ndim:", data.ndim
    padding = ((0, n ** 2 - data.shape[0]), (0, padsize), (0, padsize)) + ((0, 0),) * (data.ndim - 3)
    print "padding:", padding
    data = np.pad(data, padding, mode='constant', constant_values=(padval, padval))
    print "data:", data
    # 先將padding後的data分成n*n張影象
    print "data.shape[1:]:", data.shape[1:]
    data = data.reshape((n, n) + data.shape[1:]).transpose((0, 2, 1, 3) + tuple(range(4, data.ndim + 1)))
    print "data.shape:", data.shape
    print "data.shape[4:]:", data.shape[4:]
    # 再將（n, W, n, H）變換成(n*w, n*H)
    data = data.reshape((n * data.shape[1], n * data.shape[3]) + data.shape[4:])
    print "data.shape:", data.shape
    plt.set_cmap('gray')
    plt.imshow(data)
    plt.imsave("conv2.jpg",data)
    plt.axis('off')

if __name__ == '__main__':
    print "Print the caffe.Net:"
    #初始化caffe       
    net = caffe.Net(deploy_file,model_file,caffe.TEST)
    print "Print net.params.items:"
    print [(k, v[0].data.shape) for k, v in net.params.items()]

    #第一個卷積層，引數規模為(50,20,5,5)，即50個5*5的1通道filter
    weight = net.params["conv2"][0].data
    print "Print weight.shape:"
    print weight.shape
    show_weight(weight.reshape(50*20,5,5)) # [!!!]引數取決於weight.shape

特徵圖視覺化

輸入一張圖片，能夠看到它在每一層的效果：

# -*- coding: utf-8 -*-
# file:test_extract_weights.py

import numpy as np
import matplotlib.pyplot as plt
import os
import sys
import caffe

deploy_file = "./mnist_deploy.prototxt"
model_file  = "./lenet_iter_10000.caffemodel"
test_data   = "./5.jpg"

#編寫一個函式，用於顯示各層的引數,padsize用於設定圖片間隔空隙,padval用於調整亮度 
def show_data(data, padsize=1, padval=0):
    #歸一化
    data -= data.min()
    data /= data.max()

    #根據data中圖片數量data.shape[0]，計算最後輸出時每行每列圖片數n
    n = int(np.ceil(np.sqrt(data.shape[0])))
    # padding = ((圖片個數維度的padding),(圖片高的padding), (圖片寬的padding), ....)
    padding = ((0, n ** 2 - data.shape[0]), (0, padsize), (0, padsize)) + ((0, 0),) * (data.ndim - 3)
    data = np.pad(data, padding, mode='constant', constant_values=(padval, padval))

    # 先將padding後的data分成n*n張影象
    data = data.reshape((n, n) + data.shape[1:]).transpose((0, 2, 1, 3) + tuple(range(4, data.ndim + 1)))
    # 再將（n, W, n, H）變換成(n*w, n*H)
    data = data.reshape((n * data.shape[1], n * data.shape[3]) + data.shape[4:])
    plt.set_cmap('gray')
    plt.imshow(data)
    plt.imsave("conv1_data.jpg",data)
    plt.axis('off')


if __name__ == '__main__':

    #如果是用了GPU
    #caffe.set_mode_gpu()

    #初始化caffe 
    net = caffe.Net(deploy_file, model_file, caffe.TEST)

    #資料輸入預處理
    # 'data'對應於deploy檔案：
    # input: "data"
    # input_dim: 1
    # input_dim: 1
    # input_dim: 28
    # input_dim: 28
    transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape})
    # python讀取的圖片檔案格式為H×W×K，需轉化為K×H×W
    transformer.set_transpose('data', (2, 0, 1))

    # python中將圖片儲存為[0, 1]
    # 如果模型輸入用的是0~255的原始格式，則需要做以下轉換
    # transformer.set_raw_scale('data', 255)

    # caffe中圖片是BGR格式，而原始格式是RGB，所以要轉化
    transformer.set_channel_swap('data', (2, 1, 0))

    # 將輸入圖片格式轉化為合適格式（與deploy檔案相同）
    net.blobs['data'].reshape(1, 3, 227, 227)

    #讀取圖片
    #引數color: True(default)是彩色圖，False是灰度圖
    img = caffe.io.load_image(test_data)

    # 資料輸入、預處理
    net.blobs['data'].data[...] = transformer.preprocess('data', img)

    # 前向迭代，即分類
    out = net.forward()

    # 輸出結果為各個可能分類的概率分佈
    predicts = out['prob']
    print "Prob:"
    print predicts

    # 上述'prob'來源於deploy檔案：
    # layer {
    # name: "prob"
    # type: "Softmax"
    # bottom: "ip2"
    # top: "prob"
    # }
    #最可能分類
    predict = predicts.argmax()
    print "Result:"
    print predict

    #---------------------------- 顯示特徵圖 -------------------------------
    feature = net.blobs['conv1'].data
    show_data(feature.reshape(96*3,217,217))

視覺化loss和accurary曲線

caffe提供了{caffe_root}/tools/extra/plot_training_log.py工具視覺化loss和accurary曲線。plot_training_log.py的用法：

Usage:
    ./plot_training_log.py chart_type[0-7] /where/to/save.png /path/to/first.log ...
Notes:
    1. Supporting multiple logs.
    2. Log file name must end with the lower-cased ".log".
Supported chart types:
    0: Test accuracy  vs. Iters
    1: Test accuracy  vs. Seconds
    2: Test loss  vs. Iters
    3: Test loss  vs. Seconds
    4: Train learning rate  vs. Iters
    5: Train learning rate  vs. Seconds
    6: Train loss  vs. Iters
    7: Train loss  vs. Seconds

/path/to/first.log：這裡的log就是訓練時列印在螢幕上的日誌檔案，儲存在.log檔案中。

效果圖：
這裡寫圖片描述

Caffe原始碼解讀（九）：Caffe視覺化工具

從網路結構視覺化、caffemodel的視覺化、特徵圖視覺化、視覺化loss和accurary曲線等四個方面講視覺化網路結構視覺化有兩種辦法：draw_net.py工具和線上視覺化工具，推薦後者，靈活簡便。 1、使用draw_net.py工具

Caffe原始碼解讀（一）：caffe.proto（上）

caffe.proto檔案位於 ..\caffe-fast-rcnn\src\caffe\proto檔案目錄下，根目錄為 py_faster_rcnn資料夾 syntax = "proto2"; package caffe; // repeated require

pytorch學習筆記（八）：PytTorch視覺化工具 visdom

Visdom PyTorch視覺化工具本文翻譯的時候把略去了 Torch部分。專案地址一個靈活的視覺化工具，可用來對於實時，富資料的建立，組織和共享。支援Torch和Numpy。總覽基本概念Setup啟動視覺化介面總結總覽 Visdom目的是促

Caffe視覺化（一）：網路結構視覺化（用Caffe自帶程式實現）

Caffe視覺化（一）：網路結構視覺化（用Caffe自帶程式實現）本文記錄瞭如何利用Caffe自帶的程式實現網路的視覺化，包括可能遇到的問題和解決方案。更新於2018.10.25。文章目錄 Caffe視覺化（一）：網路結構視覺化（用Caffe自帶程式實現

ORB-SLAM2原始碼解讀（1）：系統入口System

先要拿大名鼎鼎的ORB-SLAM系統框圖鎮樓，看著這張圖能夠完美的串起來整個流程。 ORB-SLAM分三個執行緒，分別是Tracking、LocalMapping和LoopClosing。（1）Tracking：在主執行緒上，輸入視訊流，輸出相機位姿並跟蹤區域

原始碼解讀（一）：String類

曾聽過這麼一句話，美的東西看多了，自己創作的東西也會有所提高。我們的程式設計亦是如此，多看看大神的程式碼，欣賞他們的程式設計藝術，對我們的程式設計會有很大的幫助。而很多人經常忽略這一點，今天就讓ShowTime給大家送上第一道JDK大餐——解讀String類。第一步看看String

eos原始碼賞析（九）：EOS智慧合約入門之區塊打包和廣播機制

首先感謝群裡的大佬中山狼、linx、阿泥豆等各位給予的指導。在上篇文章中我們寫到了eos中區塊產生的呼叫流程，其主要過程是從外掛中的producer_pligin去產生區塊，而實際產生區塊的過程卻是在chain中的controller.cpp中實現的。通過以前的文章我們知

ORB-SLAM2原始碼解讀（4）：LocalClosing

VO總是會有累計誤差，而LoopClosing通過檢測是否曾經來過此處，進行後端優化，可以將這個累計誤差縮小到一個可接受的範圍內。閉環是一個比BA更加強烈、更加準確的約束，從而使得Slam系統應對大範圍場景時，擁有更高的魯棒性和可用性。整個LoopClosing模組是

Unity Editor 基礎篇（九）：EditorUtility編輯器工具

EditorUtility 編輯器工具轉自：http://blog.csdn.net/liqiangeastsun/article/details/42174339，請檢視原文,尊重樓主原創版權。這是一個編輯器類，如果想使用它你需要把它放到工程目錄下的Assets/E

深度學習caffe實戰筆記（13）利用MATLAB視覺化mnist資料集

之前的部落格中介紹過利用MATLAB視覺化影象特徵，因為最近在看《深度學習21天實戰caffe》，裡面有一章節是關於視覺化的，所以把視覺化mnist資料集的程式碼共享一下，在這裡要感謝趙永科老師 clc; clear; close all; image_fil

深度學習Caffe實戰筆記（15）CNN網路結構視覺化

利用python是可以實現卷積網路結構的視覺化的，但是window平臺下使用相當麻煩，這裡介紹一種非常方便快捷的視覺化方法，這個是珍藏已久的東西啦，今天拿出來分享一下，再次感謝課題組大師姐老龐，老龐師姐，你真美！網址: http://ethereon.gi

TensorFlow2.0（9）：TensorBoard視覺化

注：本系列所有部落格將持續更新併發布在github上，您可以通過github下載本系列所有文章筆記檔案。 1 神器級的TensorBoard&p

小白學 Python 資料分析（15）：資料視覺化概述

![](https://cdn.geekdigging.com/python/spider-blog/Python_logo.jpg) > 人生苦短，我用 Python 前文傳送門： [小白學 Python 資料分析（1）：資料分析基礎](https://www.geekdigging.com/2020

從零開始學caffe（九）：在Windows下實現影象識別

本系列文章主要介紹了在win10系統下caffe的安裝編譯，運用CPU和GPU完成簡單的小專案，文章之間具有一定延續性。 step1:準備資料集資料集是進行深度學習的第一步，在這裡我們從以下五個連結中下載所需要的資料集： animal flower plane hou

Caffe 使用記錄（五）：math_functions 分析

nbsp after caf oat 全部 rand() sad oid end 本文轉載自 Caffe源碼（一）：math_functions 分析 math_function 定義了caffe 中用到的一些矩陣操作和數值計算的一些函數，這裏以float類型為例做

JUC原始碼分析-集合篇（九）：LinkedBlockingQueue

LinkedBlockingQueue 是單向連結串列結構的自定義容量的阻塞佇列，元素操作按照** FIFO **(first-in-first-out 先入先出) 的順序，使用顯式鎖 ReentrantLock 和 Condition 來保證執行緒安全。連結串列結構的佇列

從零開始學caffe（十）：caffe中snashop的使用

在caffe的訓練期間，我們有時候會遇到一些不可控的以外導致訓練停止（如停電、裝置故障燈），我們就不得不重新開始訓練，這對於一些大型專案而言是非常致命的。在這裡，我們介紹一些caffe中的snashop。利用snashop我們就可以實現訓練的繼續進行。在之前我們訓練得到的檔案中，我們發現

從零開始學caffe（八）：Caffe在Windows環境下GPU版本的安裝

之前我們已經安裝過caffe的CPU版本，但是在MNIST手寫數字識別中，我們發現caffe的CPU版本執行速度較慢，訓練效率不高。因此，在這裡我們安裝了caffe的GPU版本，並使用GPU版本的caffe同樣對手寫MNIST數字集進行訓練。 step1: 安裝CUDA

從零開始學caffe（二）：caffe在win10下的安裝編譯

環境要求作業系統：64位windows10 編譯環境：Visual Studio 2013 Ultimate版本安裝流程 step1：檔案的下載從GitHub新增連結描述中下載Windows版本的caffe，並進行解壓到電腦中。 step2:檔案修改將壓縮包

caffe入門學習（5）：繪製網路結構圖

網路配置都是在prototxt檔案中看起來不直觀，如果能直接看到各層的連線圖就了，Caffe提供了這樣的工具。本文就是描述我用draw_net.py繪製網路結構圖的踏坑過程。 1、安裝graphviz 2）安裝程式執行安裝程式完成後將路徑下的

Caffe原始碼解讀（九）：Caffe視覺化工具

網路結構視覺化

1、使用draw_net.py工具

2、線上視覺化工具

caffemodel的視覺化

特徵圖視覺化

視覺化loss和accurary曲線

相關推薦