Core Concepts
検索を活用することで、追加のトレーニングを必要とせずに、継続的に拡張される大規模な語彙に対応可能なセグメンテーションを実現する。
Abstract
本研究では、従来のセグメンテーションモデルがトレーニングを通じて語彙を拡張する際に生じる「概念忘却」の問題に着目している。概念忘却とは、新しい概念を学習する際に既存の概念の認識能力が低下してしまう現象である。
提案手法のkNN-CLIPは、検索データベースを活用することで、追加のトレーニングを必要とせずに、継続的に語彙を拡張できる。具体的には以下の通り:
事前に構築した特徴量データベースを活用し、入力画像のマスクに対して最近傍検索を行う。
検索結果から得られた類似度スコアを用いて、元の予測結果を補正する。
これにより、既存の概念の認識能力を維持しつつ、新しい概念の追加が可能となる。
実験の結果、提案手法はセマンティックセグメンテーションおよびパノプティックセグメンテーションの各ベンチマークにおいて、大幅な性能向上を達成した。特に、長尾分布の概念を含む大規模な語彙に対して顕著な効果が確認された。
Stats
従来手法では、新しい概念を学習する際に既存の概念の認識能力が最大で24 mIoU低下する
提案手法kNN-CLIPでは、ADE20Kデータセットにおいて7.2 mIoUの性能向上を達成
Quotes
「従来の継続学習手法では、限られたパラメータ空間に新しい情報を埋め込むことで、過去の知識を不可逆的に上書きしてしまう」
「提案手法kNN-CLIPは、追加のトレーニングを必要とせずに、メモリコストも抑えつつ、継続的に語彙を拡張できる」