Kernkonzepte
本文设计了一系列基于非学习算子的旋转不变卷积操作(RIConvs)。这些RIConvs与对应的传统卷积具有相同的可学习参数数量,且计算过程相似,可以相互替换。通过实验验证了RIConvs在不同旋转角度下的不变性,并将其与现有的旋转不变CNN模型进行了比较。基于梯度算子设计的两种RIConvs取得了最佳结果。
Zusammenfassung
本文提出了一系列基于非学习算子的旋转不变卷积操作(RIConvs),包括基于Sobel算子、高斯导数、排序操作、最大值操作和LBP特征等。这些RIConvs与对应的传统卷积具有相同的可学习参数数量,且计算过程相似,可以相互替换。
首先,在MNIST-Rot数据集上验证了不同RIConvs在各种旋转角度下的不变性,并与现有的旋转不变CNN模型进行了比较。结果表明,基于梯度算子设计的两种RIConvs(SB-Conv和GD-Conv)取得了最佳结果,超越了之前的最佳方法。而基于最大值操作和LBP特征的RIConvs性能较差,主要是由于在某些情况下无法准确估计局部区域的旋转角度。
接下来,将这些RIConvs集成到经典的CNN骨干网络(如VGG、Inception、ResNet等)中,在纹理图像分类、飞机类型识别和遥感图像分类等实际任务上进行了评估。结果表明,RIConvs能显著提高这些CNN骨干网络的分类准确率,尤其是在训练数据有限的情况下。此外,即使在使用数据增强的情况下,RIConvs仍然能进一步提高模型性能。
Statistiken
在MNIST-Rot数据集上,SB-CNN、GD-CNN和ST-CNN的分类准确率分别达到95.68%、95.35%和95.05%,超越了之前最佳的94.37%。
在NWPU-RESISC45数据集上,当训练样本数为18000时,SB-ResNet18、GD-ResNet和MAX-ResNet18的分类准确率分别为90.63%、90.92%和90.55%,而原始ResNet18仅为82.85%。