首页 > 代码库 > FCN网络的训练——以SIFT-Flow 数据集为例
FCN网络的训练——以SIFT-Flow 数据集为例
参考文章: http://blog.csdn.net/u013059662/article/details/52770198
caffe的安装配置,以及fcn的使用在我前边的文章当中都已经提及到了,这边不会再细讲。在下边的内容当中,我们来看看如何使用别人提供的数据集来训练自己的模型!在这篇文章之后,我计划还要再写如何fine-tune和制作自己的数据集,以及用自己的数据集fine-tune。
(一)数据准备(以SIFT-Flow 数据集为例)
下载数据集: http://pan.baidu.com/s/1dFxaAtj ,并解压至/fcn.berkeleyvision.org/data/
下,并将文件夹名重命名为sift-flow
。之后,将数据全部resize到500*500。
这里一定要注意,/fcn.berkeleyvision.org/data/下本来就有一个文件夹叫sift-flow,千万不要覆盖。同时,这些原本就存在的文件夹里的东西还要全部复制到新解压的sift-flow文件夹下边。你可以先把原本的sift-slow重新命名为sitf-flow_1,然后再解压复制!
(二) 下载预训练模型
下载VGG-16的预训练模型放至/fcn.berkeleyvision.org/ilsvrc-nets/
目录下,并重命名为vgg16-fcn.caffemodel
。
下载地址: http://pan.baidu.com/s/1gfeF4wN
(三)源码修改
1. prototxt文件修改
进入siftflow-fcn32s
文件夹下,将test.prototxt
和trainval.prototxt
中的fc6
和fc7
分别替换为其他名称,例如:fc6_new
和fc7_new
。
原因是我们下载的预训练模型VGG-16原模型中包含有fc6和fc7这两个全连接层,而在prototxt中,使我们新添加的卷积层,在模型加载时,如果名称一样,而结构数据不同,便会报错。如果改名之后,原来的fc6/7则会被忽略,而使用我们新的层。
2. caffe path的加入
由于FCN代码和caffe代码是独立的文件夹,因此,须将caffe的Python接口加入到path中去。这里有两种方案,一种是在所有代码中出现import caffe
之前,加入:
1 import sys 2 sys.path.append(‘caffe根目录/python‘)
另一种一劳永逸的方法是:在终端或者bashrc中将接口加入到PYTHONPATH
中:
export PYTHONPATH=caffe根目录/python:$PYTHONPATH
(四)训练
1 $ cd cd siftflow-fcn32s/ 2 $ python solve.py
这里会遇见几个问题:
(1)No module named surgery,score
原因是下载的fcn源码解压根目录下有两个文件:surgery.py和score.py。这两个文件是下载下来就自带的,并不是caffe自带的,也不是前边我安装caffe时需要配置的。由于我是在/fcn根目录/siftflow-fcn32s/这个文件夹下执行的,会导致找不到这两个文件。所以,解决方案就是:
cp surgery.py score.py ./siftflow-fcn32s/
将surgery.py和score.py拷贝到siftflow-fcn32s下。
(2)ImportError: No module named setproctitle
解决方案是:安装setproctitle! sudo pip install setproctitle
(3)IndexError: list index out of range
解决方案:修改GPU编号为0号GPU
(4)No modulw named siftflow_layers
解决方案:疯了,干错把根目录下边的所有.py文件全拷贝到siftflow-fcn32s里边去吧。
好了,现在可以开始训练了!看看训练过程:
由于损失loss很大,我也不知道什么时候能收敛,所以先放一放,等跑出结果来我再过来更新!
FCN网络的训练——以SIFT-Flow 数据集为例