MxNet 錯誤--視訊記憶體不足(Failed to find any forward convolution algorithm.|| Out of memory)
前提:
用144*128 的資料訓練mobileNet原始模型。訓練的時候超引數的不同,出現的幾個錯誤。
裝置:
GTX 1080 8G視訊記憶體。
錯誤出現情況:
1.out of memory
超引數設定:
batch_size=256 gpu=0,1
或者
batch_size=128 gpu=0,1
2.Failed to find any forward convolution algorithm
引數設定:
batch_size=256 gpu=0
原因查詢:
網上百度了一下,發現並沒有相應的解釋,如果要追求根本的話應該看一下原始碼,那就是cudnn_convolution-inl.h檔案和記憶體管理檔案了,有點長了,等有時間再仔細讀一下。
問題定位排查:
猜想是視訊記憶體不足,因為發現不同的超引數,錯誤不一樣,或者沒有問題了。所以應該是視訊記憶體不足,在設定batch_size=128 gpu=0,1的時候也看了一下顯示卡的執行情況,果然是11G/16G的佔用,所以反推應該是視訊記憶體不夠。
解決辦法:
1.減少batch_size。
2.增加gpu數量。
3.縮小模型。
相關推薦
MxNet 錯誤--視訊記憶體不足(Failed to find any forward convolution algorithm.|| Out of memory)
前提: 用144*128 的資料訓練mobileNet原始模型。訓練的時候超引數的不同,出現的幾個錯誤。 裝置: GTX 1080 8G視訊記憶體。 錯誤出現情況: 1.out of memory 超引數設定: batch_size=256 gpu=0,1
Android爬坑之旅之FileProvider(Failed to find configured root that contains)
最近在測試FileProvider相關功能的時候,在從自定義相簿選擇圖片通過FileProvider來獲取content uri的時候程式突然崩潰了,報出了 Failed to find configured root that contains xxxx
徹底解決 Mechanism level: Failed to find any Kerberos tgt
Secure Client Cannot Connect ([Caused by GSSException: No valid credentials provided(Mechanism level: Failed to find any Kerberos tgt)]) https://hbase.apa
Android避免記憶體溢位(Out of Memory)方法總結
避免記憶體溢位的方法,主要是對以下三個方面對程式進行優化 記憶體引用 在處理記憶體引用之前,我們先來複習下什麼是強引用、軟引用、弱引用、虛引用 強引用:強引用是使用最普遍的引用。如果一個物件具有強引用,那垃圾回收器絕不會回收它。 當記憶體空間不足,Java虛擬機器寧願丟擲O
Android 載入圖片過程導致記憶體溢位(Out Of Memory)
載入圖片的時候,啪啪啪就OOM了。 解決圖片OOM之前,先來了解一下一張圖片記憶體佔用的相關因素——圖片質量,圖片尺寸,填充區域 圖片質量 質量就是圖片大小(多少MB,多少KB)。相對情況下圖片越大,佔用記憶體越大 圖片尺寸 圖片尺寸=圖片的寬高,
tensorflow 匯出模型時報錯 Unsuccessful TensorSliceReader constructor: Failed to find any matching files
筆者最近用tensorflow匯出模型時報錯:NotFoundError (see above for traceback): Unsuccessful TensorSliceReader constructor: Failed to find any matching fi
記憶體洩漏(memory leak)和記憶體溢位(out of memory)
一、概念: memory leak---記憶體洩漏:是指程式申請記憶體空間後,無法釋放。然而,記憶體洩漏不斷疊加會導致系統把記憶體花完,以致於發生記憶體溢位。(用了不還) out of memory-
Android遇到記憶體溢位(Out Of Memory)BUG的經驗與解決方法
突然出現的Out Of Memory這個BUG導致我們專案中斷了好幾天,在經過不斷地摸索之後,今天終於得到了解決。鑑於其強大的破壞力與多發性(尤其是當開發圖形豐富的軟體時),在此將解決方法同大家分享,希望大家以後少走彎路,而本人水平有限,如有不當,還望指教! 那
記錄一個奇怪的錯誤,javax.mail.MessagingException: Failed to load IMAP envelope(Android development)
前言 遇到問題,多溝通,冷靜分析,即能解決! 錯誤截圖 上面兩個圖就是出現這個錯誤的log,我用的是JavaMail1.6.0正式版,使用IMAP收取公司郵箱郵件的時候出現的這個問題,可
(轉)啟動網卡報錯(Failed to start LSB: Bring up/down networking )解決辦法總結
deb contain ade nag disabled dev nta container save 啟動網卡報錯(Failed to start LSB: Bring up/down networking )解決辦法總結 原文:http://blog.51cto.com
Centos7 網絡出錯(failed to start LSB: Bring up/down networking )
top n ger 連接 class 無法連接 無法 分享圖片 lsb 內存 這是我更換了VM虛擬機內存,重啟後無法連接網絡。 然後這是因為NetworkManager.service這個程序造成 解決方法: systemctl disable NetworkManag
在ubuntu更新時,出現錯誤E: Some index files failed to download, they have been ignored, or old ones used inst
http://www.songyawei.cn/content/3479 在ubuntu更新時,出現錯誤E: Some index files failed to download, they have been ignored, or old ones used inst
Nginx反向代理上傳大檔案報錯(failed to load resource : net :: ERR_CONNECTION_RESET)
轉自: https://blog.csdn.net/kinginblue/article/details/50753271?locationNum=14&fps=1 Nginx反向代理上傳大檔案報錯(failed to load resource : net :: ERR_CONNECTION_R
【Error】gdb.attach錯誤 Failed to read a valid object file image from memory.
python指令碼中pwntools gdb.attach遇到錯誤:Failed to read a valid object file image from memory. ****** Your encoding (ANSI_X3.4-1968) is different than UT
【轉】【centos】啟動網絡卡報錯(Failed to start LSB: Bring up/down networking )解決辦法總結
今天一臺一直在用的虛擬機器重啟後,CRT連線不上,ip也ping不通,重啟網絡卡報錯,“Failed to start LSB: Bring up/down networking”,參考:http://blog.51cto.com/11863547/1905929,解決。 遇到這個錯誤好幾次,所以總結了一下
Android7.0編譯出現問題(Failed to contact Jack server)
Android N,O在初始原始碼編譯時,很多會出現Failed to contact Jack server: Problem reading .jack-server/client.pem. Try 'jack-diagnose' 這種報錯的情況。解決辦法如下: 一、 .jack-s
微信小程式真機除錯錯誤:setStorageSync:fail Error: Failed To Send Sync
今天真是被這個坑搞得腦虧疼,本來想再storage裡快取下openId和token,但是不管用自己封裝的方法還是微信原生的wx.setStorage方法報錯: setStorageSync:fail Error: Failed To Send Sync 找了很多
解決com.alibaba.dubbo.rpc.RpcException: Failed to invoke the method Tried 3 times of the providers 錯誤
2018-08-29 小賴 文件初始化 解決com.alibaba.dubbo.rpc.RpcException: Failed to invoke the method newModel in the service com.xxx.service.x
Android 錯誤:Throwing OutOfMemoryError "Failed to allocate a 898716 byte allocation with
1.首先Throwing OutOfMemoryError 絕大部分是記憶體溢位,首先確保你的手機是否記憶體足夠執行該軟體 2.儘量不要將context、activity寫成靜態很容易錯亂 3.每個活動可以指定不同的載入模式 這裡有一篇文章寫的很詳細https://www.jianshu.c
關於Spark報錯不能連線到Server的解決辦法(Failed to connect to master master_hostname:7077)
問題產生 Spark叢集,即可以基於Mesos或YARN來部署,也可以用自帶的叢集管理器,部署於standalone模式下。筆者在部署standalone模式時, 首先,通過如下命令,啟動了Master。 ./sbin/start-master.sh