1 查阅资料

查阅了许多国内外资料，在解释旋转不变性的时候，普遍得出来，CNN具有一定的旋转不变性，但是这个旋转不变性是有一定的角度控制的，当然起作用的是maxpooling 层，当我们正面拍一些照片的时候，在某些地方会得到activation.然后旋转一定的角度之后，这个依然在相同的点得到activation区域。当然决定这个区域的是maxpooling 层，所以说maxpooling越大可以旋转保持抽取特征不变性的角度就越大。现在很多人解决这种问题的方法都是用data augmentation。

data augmentation:人工增加训练集的大小. 通过平移, 翻转, 加噪声等方法从已有数据中创造出一批"新"的数据

当然这位仁兄介绍的比较仔细，传送门：http://www.cnblogs.com/love6tao/p/5841648.html，但是这种方法，很容易导致模型过拟合。有没有一种方法能解决这个问题呢，下面我来介绍一篇CVPR 2016上的文章。

2 论文介绍

论文名字：RIFD-CNN: Rotation-Invariant and Fisher Discriminative Convolutional Neural Networks for Object Detection

当然这篇文章介绍了旋转不变性改进，和判别改进，但是我这里只介绍一种。

R-CNN模型图：

技术分享

它这个模型其实很简答，前面就是data augmentation. 然后放上传统的CNN层（VGGNet,AlexNet）. 技术分享是传统网络分类层的前一层。本模型是在之间加了层以保证模型的旋转不变性。

模型分为两层：一层data augmentation 和model training.

Data augmentation:给一些列初始的训练样本技术分享 ,我们通过旋转变化得到了一系列新的训练样本：,其中是正样本，是负样本，是一些列的k个旋转角度。

model training：为了达到旋转不变的特性，文章增加了一个旋转不变全连接层技术分享。中的m是除了分类层次的所有层数。不像传统的卷积神经网络，仅仅优化多项逻辑斯蒂回归，即y的值是多项的，是大于2分类的（0,1,2）。具体不多说，传送门，讲的很详细：http://www.docin.com/p-586309778.html