Core Concepts
提案手法は、CNNの重みと構造を共同で学習・圧縮する新しい手法である。強化学習エージェントの行動によってCNNの各層の圧縮率が決まり、その結果のモデルの精度を報酬として用いる。また、モデルの重みと選択された構造を整合させる正則化項を導入することで、圧縮後のモデルの性能を容易に回復できる。
Abstract
本論文は、CNNの重みと構造を共同で学習・圧縮する新しい手法を提案している。
強化学習エージェントの行動によってCNNの各層の圧縮率が決まる。各層の状態(チャンネル数、カーネルサイズ、FLOPSなど)と前の層の圧縮率に基づいて状態を定義し、最終的な圧縮モデルの精度を報酬として用いる。
モデルの重みと選択された構造を整合させるための正則化項を導入する。これにより、圧縮後のモデルの性能を容易に回復できる。
モデルの重みが更新されるため、報酬関数が非定常になる問題に対処するため、各エポックの埋め込みを用いて環境の変化をモデル化し、エージェントに提供する。
実験では、CIFAR-10とImageNetデータセットでResNetやMobileNetを圧縮し、従来手法と比較して優れた性能を示している。
Stats
CNNの各層のチャンネル数、カーネルサイズ、ストライド、FLOPSの値
圧縮前後のモデルの精度(Top-1 Accuracy、Top-5 Accuracy)
圧縮前後のモデルのFLOPS削減率