【用Python學習Caffe】5. 生成solver檔案

阿新 • • 發佈：2019-02-11

5. 生成solver檔案

網路訓練一般是通過solver來進行的。對於caffe來說，其是通過solver檔案來生成solver訓練器進行網路訓練及測試的，該solver檔案中包含了訓練及測試網路的配置檔案的地址，及相關訓練方法及一些訓練的超引數，該檔案一般不是很大，可以直接在一些solver.prototxt檔案上更改。也可以通過Python結合caffe_pb2.SolverParameter()結構自動生成solver.prototxt檔案

    def solver_file(model_root, model_name):
        s = caffe_pb2.SolverParameter() # 宣告solver結構
        s.train_net = model_root+'train.prototxt' # 訓練網路結構配置檔案
        s.test_net.append(model_root+'test.prototxt') # 測試時網路結構配置檔案，測試網路可有多個
        # 每訓練迭代test_interval次進行一次測試。
        s.test_interval = 500
        # 每次測試時的批量數，測試裡網路可有多個
        s.test_iter.append(100)
        # 最大訓練迭代次數
        s.max_iter = 10000
        # 基礎學習率
        s.base_lr = 0.01
        # 動量，記憶因子
        s.momentum = 0.9
        # 權重衰減值，遺忘因子
        s.weight_decay = 5e-4
        # 學習率變化策略。可選引數：fixed、step、exp、inv、multistep
        # fixed: 保持base_lr不變；
        # step: 學習率變化規律base_lr * gamma ^ (floor(iter / stepsize))，其中iter表示當前的迭代次數；
        # exp: 學習率變化規律base_lr * gamma ^ iter；
        # inv: 還需要設定一個power，學習率變化規律base_lr * (1 + gamma * iter) ^ (- power)；
        # multistep: 還需要設定一個stepvalue，這個引數和step相似，step是均勻等間隔變化，而multistep則是根據stepvalue值變化；
        #   stepvalue引數說明：
        #       poly: 學習率進行多項式誤差，返回base_lr (1 - iter/max_iter) ^ (power)；
        #       sigmoid: 學習率進行sigmod衰減，返回base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))。
        s.lr_policy = 'inv'
        s.gamma = 0.0001
        s.power = 0.75

        s.display = 100 # 每迭代display次顯示結果
        s.snapshot = 5000 # 儲存臨時模型的迭代數
        s.snapshot_prefix = model_root+model_name+'shapshot' # 模型字首，就是訓練好生成model的名字
        s.type = 'SGD' # 訓練方法（各類梯度下降法），可選引數：SGD，AdaDelta，AdaGrad，Adam，Nesterov，RMSProp
        s.solver_mode = caffe_pb2.SolverParameter.GPU # 訓練及測試模型，GPU或CPU

        solver_file=model_root+'solver.prototxt' # 要儲存的solver檔名

        with open(solver_file, 'w') as f:
            f.write(str(s))

5.1 具體程式碼下載

【用Python學習Caffe】5. 生成solver檔案

5. 生成solver檔案網路訓練一般是通過solver來進行的。對於caffe來說，其是通過solver檔案來生成solver訓練器進行網路訓練及測試的，該solver檔案中包含了訓練及測試網路的配置檔案的地址，及相關訓練方法及一些訓練的超引數，該檔案一般

【用Python學習Caffe】8. 網路結構的權重共享量化

8. 網路結構的權重共享量化網路權重共享量化也是一類重要的網路壓縮方法，其本質在於先通過聚類方法得到該層權重的聚類中心，然後通過聚類中心值來表示原權重值。因此權重值並不是由32位的浮點數來表示，而是由其對應的聚類中心的序號表示，如果聚類級別為8位，此時權重值

【用Python學習Caffe】4. 設計自己的網路結構

4. 設計自己的網路結構通過前文的例子，我們都知道了Caffe的網路都是一個prototxt的網路結構配置檔案定義的，該檔案可以用文字工具開啟，開啟後，我們可以看到如下結構： layer { name: "data" typ

【python學習筆記】列表生成式和生成器

一、列表生成式列表生成式即List Comprehensions，是Python內建的非常簡單卻強大的可以用來建立list的生成式。列表生成式由包含一個表示式的括號組成，表示式後面跟隨一個for子句，之後可以有零或多個for或if子句。結果是一個列表，由表示

【SciKit-Learn學習筆記】5：核SVM分類和預測乳腺癌資料集

學習《scikit-learn機器學習》時的一些實踐。常用引數引數C SVM分類器svm.SVC()中的引數C即SVM所優化的目標函式 a

【Vue.js學習筆記】5：雙向資料繫結,計算屬性

雙向資料繫結雙向資料繫結往往會用到input、select、textarea等表單標籤上，因為總是涉及一個數據資料的地方和輸出資料的地方。當資料發生變化的時候，檢視也就發生變化，當檢視發生變化的時候，資料也會跟著同步變化。資料雙向繫結，一定是對於UI控制元件來說的，

【SQL Server學習筆記】5：使用INSERT語句插入資料

使用SQL語句的意義是，要開發的DBAS應用程式不能像人一樣通過SSMS工具來操作資料，SQL語句是應用程式和資料庫通訊的橋樑。而且相比手動圖形化操作，SQL語句更加方便和強大。 SQL(結構化查詢語言)的組成 ①DML(資料操作語言) 插入、刪除和修

【4】caffe的python介面學習：生成solver檔案

caffe在訓練的時候，需要一些引數設定，我們一般將這些引數設定在一個叫solver.prototxt的檔案裡面，如下： base_lr: 0.001 display: 782 gamma: 0.1 lr_policy: "step" max_iter: 78200 momentum

【用python實現《統計學習方法》】之決策樹C4.5/ID3

宣告：本文根據李航博士的《統計學校方法》中的決策樹章節的原理：最大熵資訊增益、資訊增益比進行決策樹的實現。在視覺化方面主要參考的這篇博文。決策樹演算法是一類在資料探勘中應用的特別多的符號學派分類器，並在整合學習中被大大采用。經典的c4.5和id3以及後來的c

【整理】python學習筆記（5）-- pygame庫的函式和方法整理

PYGAME的方法和官方文件查詢官方文件 http://www.pygame.org/docs/ 模組簡介 pygame.BufferProxy An array protocol view

【原創】python學習筆記（5）--《笨辦法學python》，指令碼帶引數

一指令碼檔案（1）簡單的說就是一段自己寫的，可執行的程式碼，否則會報錯（2）簡單指令碼，直接 python xxx1.py （3）帶引數指令碼，需要 python xxx2.py argv1 argv2 argv3 根據指令碼引數的數量，

【python學習筆記】12：用matplotlib繪製3D函式影象

①用pyplot的figure()函式可以建立一個figure物件 ②以它為引數建立Axes3D物件，使之具有3D座標軸 ③pyplot的show()方法可以顯示所有figure物件 *顯示兩個3D座標軸 import matplotlib.pyplot as plt #

【python學習筆記】13：用梯度下降法求解最優值問題

梯度是函式在某點沿每個座標的偏導數構成的向量，它反映了函式沿著哪個方向增加得最快。因此要求解一個二元函式的極小值，只要沿著梯度的反方向走，直到函式值的變化滿足精度即可。這裡打表儲存了途徑的每個點，最後在圖上繪製出來以反映路徑。 *梯度下降的具體實現 impor

【python學習筆記】用正則表示式從含中文的網頁中提取資料（含編碼轉換）

目標：用正則表示式從含中文的網頁中提取資料 1、獲得網頁全部資料 1.1思考過程確定我們要操作的網頁：url = 'http://q.stock.sohu.com/cn/603077/cwzb.shtml' 開啟要操作的網頁：req = urllib2.open(url)

【ML學習筆記】5：機器學習中的數學基礎5(張量,哈達瑪積,生成子空間,超平面,範數)

向量/矩陣/張量向量向量可以表示成一維陣列，每個分量可以理解為向量所表示的點在空間中座標的分量。矩陣矩陣可以表示成二維陣列，上節理解了矩陣可以理解為線性對映在特定基下的一種定量描述。張量張量可以表示成任意維的陣列，張量是向量概

【python學習筆記】6：用Gauss-Legendre求積公式近似求積分值

高斯-勒讓德求積公式給出了一個定積分的近似求法：不妙的是這種求法對上下限要求為1和-1，但是因為積分可以變限，所以求任意定積分只要做變換就好：用高斯公式求積分的近似值，精確度是非常高的，一般用幾個點就可以得到很不錯的近似值。這裡用了三點高斯積分和五點高斯積分。

【Python學習筆記】python高階特性：列表生成式

【根據廖雪峰python教程整理】一、列表生成式列表生成式即List Comprehensions，是Python內建的非常簡單卻強大的可以用來建立list的生成式。舉個例子，要生成lis

Python學習3月5號【python編程從入門到實踐】---》筆記（2）

索引 modified 系列入門到忘記而不是 super 函數 end 1.操作列表　　　　一、遍歷整個列表，並且想對每一個元素執行相同的操作。##這裏就不得不提起我們一直用的For函數了。　　　　二、深入地研究循環　　　　（1）for i in

【Python學習筆記】-APP圖標顯示未讀消息數目

運行讀取 lin 簡單實現 ets fcm 筆記 python語言 lte 以小米手機系統為例，當安裝的某個APP有未讀消息時，就會在該APP圖標的右上角顯示未讀消息的數目。本文主要解說怎樣用Python語言實現圖標顯示未讀消息的數目。首先，還是要用到Python中P

【python學習筆記】6.抽象

位置參數 name 默認參數 [] 順序 fun append 聲明 value 【python學習筆記】6.抽象創建函數: 使用def語句定義函數，不用聲明參數類型，和返回值類型 def function_name(param1, param2):

【用Python學習Caffe】5. 生成solver檔案

5. 生成solver檔案

5.1 具體程式碼下載

相關推薦