[Keras] 使用Keras呼叫多GPU時出現無法儲存模型的解決方法

阿新 • • 發佈：2019-02-18

在使用keras 的並行多路GPU時出現了模型無法

儲存，在使用單個GPU時執行完全沒有問題。執行出現can't pickle的問題

隨後在網上找了很多解決方法。下面列舉一些我實驗成功的方法。

方法一

class ParallelModelCheckpoint(ModelCheckpoint):
    def __init__(self,model,filepath, monitor='val_loss', verbose=0,
                 save_best_only=False, save_weights_only=False,
                 mode='auto', period=1):
		self.single_model = model
		super(ParallelModelCheckpoint,self).__init__(filepath, monitor, verbose,save_best_only, save_weights_only,mode, period)

    def set_model(self, model):
        super(ParallelModelCheckpoint,self).set_model(self.single_model)

check_point = ParallelModelCheckpoint(single_model ,'best.hd5')

在這裡需要解釋一下這個single_model 時沒有進行並行的model

 model = Model(inputs = [inputs], outputs = [conv10])
 parallel_model = multi_gpu_model(model, gpus=2)

在這裡第一就是single_model.直接用這個model checkpoint 就可以了親測有效

方法二

original_model = ...
parallel_model = multi_gpu_model(original_model, gpus=n)

class MyCbk(keras.callbacks.Callback):

    def __init__(self, model):
         self.model_to_save = model

    def on_epoch_end(self, epoch, logs=None):
        self.model_to_save.save('model_at_epoch_%d.h5' % epoch)

cbk = MyCbk(original_model)
parallel_model.fit(..., callbacks=[cbk])

同理這裡也是一樣的。其實在上面兩種方法中可以發現，基本都是在checkpoint 問題上都是使用了單個model進行執行的。

意思就是直接使用傳入方法keras.utils.multi_gpu_model(model, gpus)中的model即可，而不要使用返回的parallel_model，

參考網站

[Keras] 使用Keras呼叫多GPU時出現無法儲存模型的解決方法

在使用keras 的並行多路GPU時出現了模型無法儲存，在使用單個GPU時執行完全沒有問題。執行出現can't pickle的問題隨後在網上找了很多解決方法。下面列舉一些我實驗成功的方法。方法一class ParallelModelCheckpoint(ModelCheckp

原碼安裝MySQL時出現的問題和解決方法

原碼安裝MySQL時出現的問題和解決方法 1.配置檔案沒有修改初始化資料庫資訊mysqld --initialize --user=mysqlmysqld --initialize --user=mysql 初始化資料庫目錄初始化成功會生成 data 目錄，屬主為 my

ANT打war包時出現重複檔案的解決方法

最近用ant給java web程式打war包時發現打出來的war包裡面WEB-INF裡的檔案均有兩個，後來發現加上一句fileset,include,exclude語句之後就沒有重複檔案了打包程式碼如下 <target name="antwar" depen

Linux umount裝置時出現device is busy解決方法

[[email protected] u06]# vgdisplay -v VolGroup03 Using volume group(s) on command line Finding volume group "VolGroup03" --- Volume group -

windows 連線遠端桌面時出現黑屏的解決方法

win7系統開啟遠端桌面功能可以方便的遠端管理伺服器或計算機，使用遠端桌面功能的時候難免會遇到一些問題。比如一些win7系統連線遠端桌面時出現黑屏，導致無法繼續進行操作，如何解決問題呢？小編以雨林木風win7系統為例，分享win7連線遠端桌面時出現黑屏的解決方法。

UE4安卓打包配置（大陸內網路整頓後，Android打包時AndroidWorks無法使用的解決方法）

由於國內進行了網路整頓，UE4官網上用CodeWorksforAndroid下載安卓打包工具配置的方法已經不能使用了，開了VPN也連結不上。這使得用UE4打包配置安卓遊戲變得非常麻煩，博主搗鼓了好幾天才打包成功，深感在中國學習UE4的艱難與曲折，UE4在國內發展

運行遊戲時出現0xc000007b錯誤的解決方法

如圖，這個錯誤使無數玩家煩惱。出現這個錯誤，可能是硬體的問題，也可能是軟體的問題。但是，由於硬體引起該問題的概率很小，並且除了更換硬體之外沒有更好的解決方法，因此本文將詳細介紹如何通過軟體解決此問題，這也是大家最關心的。大致介紹一下這個錯

連線mysql資料庫時出現1045錯誤的解決方法。

錯誤程式碼 1045 Access denied for user 'root'@'localhost' (using password:YES) 解決辦法是重新設定root使用者密碼，在Windows平臺下操作步驟如下： 1、以系統管理員身份登入到系統； 2、如果My

使用VS2017輸入輸出時出現控制檯閃退解決方法

當使用VS2017執行下列輸入輸出程式時，控制檯直接閃退： #include<iostream> using namespace std; int main() { i

ubuntu 使用sudo apt-get update 出現被配置多次導致無法升級錯誤解決方法

code 開發機 goup 使用 lin logs 配置周末 ubun 這個周六周末在考慮升級自己GPU開發機，在琢磨使用docker來按轉tensorflow環境,在升級軟件的時候爆出了如下錯誤在 /etc/apt/sources.list.d/sogoupin

在windows sever2012安裝web服務器時出現“無法打開運行空間池。服務器管理器 WinRM 插件可能已損壞或丟失”

-1 內存初始開啟 man 系統設置方法無法高級解決方法方法一：如果是沒有打開WinRM服務第一步：在服務器中選擇“工具”--“服務” 第二步：找到Windows Remote Mangement服務，如果沒打開，選擇開啟。方法二：如果上面的服務打

Asp.NET MVC 之調試訪問 webservice 時出現“ 無法找到資源 ”的錯誤

相對 mvc option logs 控制器 inf code 資源 index 　　問題情景如標題，具體錯誤如下圖：　　　　出現以上情況，是程序將 .asmx 文件按控制器方式解析了，在 RouteConfig.cs 文件的 RegisterRoutes 方法中忽略

安裝Qt creator時出現無法定位程序輸入點_except1 於動態鏈接庫MSVCR120.dll上

x86 win mark size 提示 mar msvc 這樣的系統開始不知道怎麽回事一直出現無法定位程序輸入點，_except於動態鏈接庫MSVCR120.dll上，重新下了幾個Qt版本同樣出現這樣的問題，後來在網上查了一下這兩天回老家了，沒事打算在筆記

[記錄]安裝.Net Framework 4.6.2時出現“無法建立到信任根頒發機構的證書鏈”解決方法

ctr log arr 單元 ica micode blog 下載 otc 在安裝Microsoft .NET Framework 4.6.2脫機包時提示無法建立到信任根頒發機構的證書鏈實際上是要安裝一個根證書。解決方案如下（因無法貼鏈接，可百度搜索“ma

安裝.Net Framework 4.6.2時出現“無法建立到信任根頒發機構的證書鏈”解決方法

地址 author ros 信任 .com 菜單就是計算單元在安裝Microsoft .NET Framework 4.6.2脫機包時提示無法建立到信任根頒發機構的證書鏈實際上是要安裝一個根證書 MicrosoftRootCertificateAuthority

Json序列化，有多對一和多對多關係時出現的問題

/** * 這是一張單表中的雙向一對多，多對一關係。自己跟自己一對多多對一 */ @Entity @Table(name="tb_test") public class CreditsEventBean implements Serializable{ private s

Powershell直接指令碼時出現無法載入檔案因為在此係統中禁止執行指令碼問題的解決方法

在Powershell直接指令碼時會出現：無法載入檔案 ******.ps1，因為在此係統中禁止執行指令碼。有關詳細資訊，請參閱 "get-help about_signing"。所在位置行:1 字元: 17 + E:\Test\test.ps1 <<<< + Cat

關於 C#呼叫一個C/C++dll庫執行時實現多個應用(靜態變數區分) 的解決方法

需求 VS編寫了純C（windows）通訊庫，需要多例項（靜態變數標誌一個例項，達到互相靜態變數不干涉）。當前問題 dll中使用了全域性static的標

關於PCL中使用八叉樹時出現無法解析的外部命令的錯誤*

關於PCL中使用八叉樹時出現無法解析的外部命令的錯誤 #前幾天在使用八叉樹的時候在編譯時總是出現無法解析的外部命令的錯誤 6 error LNK2001: 無法解析的外部符號 "protected: virtual bool __thiscall pcl::oc

在呼叫sklearn fit時出現 Unknown label type: 'unknown'錯誤

在呼叫sklearn selectKBest().fit時出現 Unknown label type: 'unknown'錯誤：當出現此問題時一般來說是你傳入的資料型別被呼叫函式不接受，你需要改變資料型別。 1. 例如採用卡方驗證選取特徵時，如果你傳入的是標籤是

[Keras] 使用Keras呼叫多GPU時出現無法儲存模型的解決方法

相關推薦