核心概念
オフザシェルフの物体検出モデルを、わずかなラベル付きデータを使ってオンラインで新しいドメインに適応させる革新的な手法を提案する。メモリバンクと検索拡張分類モジュールを組み合わせることで、既存の検出器に新しい概念を学習させることができる。
摘要
本論文は、オフザシェルフの物体検出モデルを、わずかなラベル付きデータを使ってオンラインで新しいドメインに適応させる革新的な手法を提案している。
提案手法の主な特徴は以下の通り:
- オンラインおよび継続的な学習が可能
- ラベル付けの必要性が最小限
- ビジュアルドメイン適応のための計算コストが不要
提案手法は、メモリバンクと検索拡張分類(RAC)モジュールから構成される。メモリバンクには、ターゲットドメインの少数のラベル付きイメージ(例えば1クラスあたり10枚)が格納される。RAC モジュールは、クエリイメージの物体提案に対して、メモリバンクからの検索結果に基づいて分類を行う。
実験では、DOTA データセットを用いたオンライン適応タスクで、従来手法と比較して大幅な性能向上を示した。特に、高品質な物体提案が得られる場合、提案手法は27.4 mAPという高い性能を達成した。
また、メモリバンクのサイズ、特徴抽出器の事前学習/fine-tuningの影響などについても詳細な分析を行っている。
統計資料
提案手法は、わずか10枚/クラスのラベル付きデータで、G-DINO検出器のmAPを2.68から4.54に、xView事前学習検出器のmAPを-から14.7に改善した。
メモリバンクのサイズを増やすことで、ROI段階のFaster R-CNNのmAPを12.7から27.4に向上させた。
特徴抽出器をfine-tuningすることで、さらに性能が向上した。
引述
"オフザシェルフの物体検出モデルを、わずかなラベル付きデータを使ってオンラインで新しいドメインに適応させる革新的な手法を提案する。"
"メモリバンクと検索拡張分類モジュールを組み合わせることで、既存の検出器に新しい概念を学習させることができる。"
"提案手法は、オンラインおよび継続的な学習が可能で、ラベル付けの必要性が最小限、ビジュアルドメイン適応のための計算コストが不要という特徴を持つ。"