核心概念
相互ブロック調整メカニズムを導入することで、セグメント・エニシング・モデルを様々な下流タスクに適応させることができる。
要約
本論文では、セグメント・エニシング・モデル(SAM)を様々な下流シナリオに適応させるために、パラメータ効率的なファインチューニング(PEFT)に相互ブロック調整メカニズムを組み込んだ手法「SAM-COBOT」を提案した。
具体的には以下の2つのモジュールを導入した:
相互ブロック通信(IBC)モジュール:
学習可能な関係行列を使って、各PEFTブロックのパラメータ空間の係数セット間の相互依存性を捉え、調整を行う。
これにより、パラメータ空間全体の射影方向の調整が可能になる。
ブロック内強化(IBE)モジュール:
ハイパー複素層を用いて、各係数要素への個別の調整を行う。
これにより、射影方向の調整がパラメータ空間全体により大きな影響を与えられるようになる。
広範な実験の結果、提案手法SAM-COBOTは既存のPEFT手法(LoRA、Adaptformer)に比べて大幅な性能向上を示し、自然画像セグメンテーション、リモートセンシング画像セグメンテーション、医療画像セグメンテーションなどの様々なタスクで優れた結果を得た。さらに、わずか1K程度のパラメータ追加で実現できることも示された。
統計
提案手法SAM-COBOTは、既存のPEFT手法(LoRA、Adaptformer)に比べて、自然画像セグメンテーションタスクのCOCOデータセットで72.1%から72.2%へ、リモートセンシング画像セグメンテーションタスクのNWPUデータセットで83.0%から84.0%へ、医療画像セグメンテーションタスクのADOMEデータセットで90.1%から91.3%と、大幅な性能向上を達成した。
SAM-COBOTは、ViT-Baseバックボーンを使用した場合、わずか1.3Kのパラメータ追加で実現できる。
引用
"相互ブロック調整メカニズムを導入することで、セグメント・エニシング・モデルを様々な下流タスクに適応させることができる。"
"提案手法SAM-COBOTは既存のPEFT手法に比べて大幅な性能向上を示し、様々なタスクで優れた結果を得た。"
"SAM-COBOTは、わずか1.3Kのパラメータ追加で実現できる。"