本文主要分享博主在Windows下配置Faster R-CNN时遇到的几个问题及其解决。水平有限,故仅对问题现象以及问题解决的经验进行了记录,而并不深晓背后的机理。
主要环境:GTX1080 + Windows7 x64 + VS2013 + MatlabR2014a
1.0 问题:
GTX1080 + Windows7 x64 + VS2013 + MatlabR2014a +cuda7.5 的环境下,用Faster Rcnn训练VOC2007时报错。安装cuda8.0总是失败。cuda8.0环境下编译Faster Rcnn时遇到问题。1.1 问题1
问题描述: 起初,我安装了cuda7.5,并且按照这个教程自己编译了Faster Rcnn,该过程虽免不了一些小问题,但是兵来将挡,最终编译成功,并且是可以用的。之后在运行Faster Rcnn里面的demo时,表现正常。但是,当我想着用VOC2007的数据集跑训练的时候,它出错了。 训练的过程分为两个阶段,分别是stage1和stage2;在每个stage内,又可分为训练rpn和训练fast rcnn这两个部分。我的训练过程表现是这样的:在stage1的rpn训练过程中,一切正常;进入fast rcnn后便出错了。如图:错误使用caffe_:glog check error,please check log and clear mex; 出错fast_rcnn_train>check_gpu_memory…(略); 出错fast_rcnn_train…(略); 出错scrip_faster_rcnn_VOC2007_ZF…
问题解决: 我以前遇到过该错误,当时以为是显卡的问题,但是现在换了1080显卡,还是存在这个问题,这使我很困惑。我搜索了一下,发现很可能是CUDA版本的问题(同时在网上我看到了“1080应该配cuda8.0”的说法),于是我想试一下cuda8。(最终,在换了cuda 8之后,问题即得到解决) 1.2 问题2问题描述: 目前官网最新的是cuda8.0.61,有network安装和local安装两种方式。对于local方式,是把1.2G——1.3G的安装包下载到本地,然后安装。但是这个当我打开这个.exe文件时,出现“7-zip:data error”的错误。可能因为是系统的问题,或者压缩软件的问题,或者数据本身不完整的问题。最后发现我一个师兄也遇到这个问题,我便大致把原因锁定为“压缩文件本身错误”。对于network方式,也总是安装不成功。对于以上两种问题,我猜测很大程度上是因为实验室的网不给力。
问题解决: 我在网上找了一个cuda8.0.44(百度云),这个很顺利就安装成功了。 应当注意,应该完全卸载了CUDA7.5之后,再装CUDA8.0。我的卸载方式是这样的:打开“控制面板->卸载” ,卸载掉关于cuda的程序;然后在C盘(我默认装在c盘)里找到近期安装的有关cuda的文件,删掉。
1.3 问题3
问题描述: 用cuda8.0+VS2013编译Faster RCNN的caffe_library->caffe.sln,我遇到了如下图所示错误。 这是opencv的问题。我参考了这篇博客,虽然编译成功了,但是不能运行demo,因此仍是不能用的。
问题解决: 后来我看到这篇博客,他和我的环境一样,还分享了自己编译好的external库。我拿过来直接用,居然一切畅通了。因此我也没再想着自己编译。 不过我发现,该博主用的是opencv2.4.9,那我是不是暂且认为我的生成失败就是因为这个OpenCV版本的问题?我没有进一步的试验。