1. 程式人生 > >caffe訓練中遇到的一些問題(持續更新......)

caffe訓練中遇到的一些問題(持續更新......)

在ubuntu14.04,64位下面,遇到下面問題,需要注意:

1、error while loading shared libraries: libmkl_rt.so: cannot open shared object file: No such file or directory
解決方法:

/etc/ld.so.conf.d/ 資料夾下增加了一個檔案命名為intel_mkl_settings.conf

然後在裡面新增MKL庫路徑/opt/intel/mkl/lib/intel64

2、error while loading shared libraries: libcudart.so.5.5: cannot open shared object file: No such file or directory
解決方法:
32-bit: sudo ldconfig /usr/local/cuda/lib
64-bit: sudo ldconfig /usr/local/cuda/lib64
執行後發現還是找不到庫, 報錯
error while loading sharedlibraries: libcudnn.so.6.5: cannot open shared object file: No such file ordirectory
而lib資料夾是在系統路徑裡的,用ls -al發現是檔案許可權的問題,因此用下述命令先刪除軟連線

cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.solibcudnn.so.6.5

然後修改檔案許可權,並建立新的軟連線

sudo chmod u=rwx,g=rx,o=rx libcudnn.so.6.5.48
sudo ln -s libcudnn.so.6.5.48 libcudnn.so.6.5
sudo ln -s libcudnn.so.6.5 libcudnn.so
sudo ldconfig -v

不做連結,可能會出現這個報錯:“./build/tools/caffe:error while loading shared libraries: libcudnn.so.6.5:cannot open shared object file: No such file or directory”那是因為cuDNN沒有連結成功,只能做一下硬連結。

3、在caffe訓練的過程中,conv操作是向下取整

pooling操作是向上取整

4、當測試時加的均值也是訓練集的均值,因為測試集是未知的(可以是一張圖片,也可以是多張圖片),我們不知道,所以它的均值也是未知的。