caffe中cifar10的full_train模型出现nan的解决办法

2024-08-09 16:13:28 218人阅读

caffe在cifar10 的example上给出了两个模型，一个是quick模式，一个是full模式，训练full模式时会出现loss=nan的错误（当然不会报错，不过出现这个结果就是bug）

自己google了一下，在github上找到了原因跟解决方案，原来是作者把用在cuda-convnet的模型照搬过来了，在caffe上的模型应该去掉LRN层，所以解决的方法很简单：将网络结构中所有的归一化层全部去掉，并修改下一层的bottom参数，然后就不会出现loss=nan的错误了。

当然，如果自己做实验时出现loss=nan的问题时，我的一个解决办法是修改学习率，改的小一点就不会出现错误了。实在不行，就把里面的relu函数变为sigmoid试一试，代价就是训练速度会非常非常慢。

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们