この論文は、深いニューラルネットワークのモデル圧縮における漸進的枝刈りの分野における新しい手法である、固定レート勾配優先漸進的枝刈り(FGGP)を提案している。
ディープラーニングモデルのサイズと計算リソースの需要の増大に伴い、精度の維持を目的としたニューラルネットワークの枝刈りが注目されている。従来の漸進的枝刈りは、目標とするネットワークのスパース性を実現するために、ネットワークのパラメータを徐々に削除していく手法である。最近の研究では、勾配と重みの両方の大きさを考慮する必要があることが示されている。
本論文では、枝刈り対象となるパラメータを選択するための勾配優先の大きさ重視戦略を導入し、これらのステップ間における固定レートの部分集合選択基準が、従来の文献で用いられてきたアニーリング手法よりも効果的であることを示す。
FGGPは、2段階の選択プロセスで枝刈り対象のパラメータを選択する。
この戦略により、まだ値が変化している、つまり勾配の大きさが大きい、収束していないパラメータに対して、大きさベースの選択が適用されることを回避する。
FGGPを評価するために、CIFAR-10データセットを用いて、ResNet-50とVGG-19アーキテクチャを用いて実験を行った。その結果、FGGPは、従来の最先端技術を上回る精度を達成した。特に、スパース性の高い目標値やResNet-50アーキテクチャの場合に、その差が顕著であった。
本論文では、構造化されていない漸進的枝刈りにおいて、勾配と重みの両方の大きさを考慮することの重要性を示した。また、枝刈りされるパラメータの優先順位付けに用いられる基準とメカニズムが不可欠であることを論じた。そして、枝刈りの最初の決定基準として、パラメータの勾配の大きさの固定比率を使用することを提案し、さまざまな設定で実験的に検証した。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問