Core Concepts
Conv-Adapterは、ConvNetのパラメータ効率的な転移学習のための軽量で汎用的なアダプテーションモジュールである。Conv-Adapterは、事前学習済みのConvNetの中間表現を効果的に調整し、様々なビジョンタスクでフルファインチューニングと同等以上の性能を達成できる。
Abstract
本論文は、ConvNetのパラメータ効率的な転移学習手法であるConv-Adapterを提案している。Conv-Adapterは、事前学習済みConvNetの中間表現を調整することで、様々なビジョンタスクにおいて高い転移性能を示す。
主な内容は以下の通り:
Conv-Adapterの設計: Conv-Adapterは、深度separable畳み込みと非線形活性化からなる軽量なボトルネック構造を持つ。これにより、中間表現の局所性を維持しつつ、パラメータ効率的な特徴の調整が可能となる。
Conv-Adapterの適用方法: Conv-Adapterは、ResNetやConvNextなどの様々なConvNetアーキテクチャに適用可能である。Conv-Adapterを畳み込み層やResidual blockに挿入する4つの適用方式を検討し、最適な方式を見出している。
性能評価: Conv-Adapterは、23種類の分類タスクにおいて、わずか3.5%のパラメータでフルファインチューニングと同等以上の性能を達成する。また、物体検出やセマンティックセグメンテーションなどの密な予測タスクでも優れた結果を示す。さらに、少数shot学習においても大幅な性能向上を実現する。
分析: Conv-Adapterの設計選択に関する ablation studyや、ドメイン変化に対する頑健性の分析を行っている。
以上のように、Conv-Adapterは、ConvNetの効率的な転移学習を可能にする汎用的なアダプテーションモジュールである。
Stats
ConvNetのパラメータ数に対して、Conv-Adapterは平均3.5%しかパラメータを必要としない
Conv-Adapterは、23種類の分類タスクでフルファインチューニングと同等以上の性能を達成
Conv-Adapterは、物体検出やセマンティックセグメンテーションなどの密な予測タスクでも優れた性能を示す
Conv-Adapterは、少数shot学習において平均3.39%の性能向上を実現する
Quotes
"Conv-Adapter は軽量、ドメイン転移可能、アーキテクチャ非依存で、様々なタスクで一般化された性能を示す。"
"Conv-Adapter は、ResNet50 BiT-M の全ファインチューニングパラメータの約3.5%しか必要としないが、23 の分類タスクで同等以上の性能を達成する。"
"Conv-Adapter は、物体検出やセマンティックセグメンテーションなどの密な予測タスクでも、50%以上のパラメータ削減で同等の性能を示す。"