本研究は、分布外検出の課題に取り組むために、ビジョン言語モデル(VLM)を活用した新しい手法「NegPrompt」を提案している。
主な特徴は以下の通り:
既知のクラスデータのみを使用して、各クラスに対する否定的なプロンプトを学習する。これにより、外部のアウトライアデータに依存せずに、既知クラスと未知クラスの境界を明確化できる。
学習した否定的プロンプトは転移可能であり、訓練時に使用したクラスの一部のみで学習を行っても、未知のクラスに対しても適用できる。これにより、オープンボキャブラリー学習シナリオでも有効に機能する。
様々なImageNetベンチマークでの実験結果から、提案手法「NegPrompt」が既存の最先端のプロンプト学習ベースの分布外検出手法を上回る性能を示すことが確認された。特に、閉じた分類と開いた分類の両方の状況で、高い分布外検出精度を維持できることが明らかになった。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies