核心概念
本研究では、特定のクラスラベルに対する否定的な意味を表すプロンプトを学習することで、既知のクラスと未知のクラスの境界を明確にし、分布外検出の性能を向上させる手法を提案する。
要約
本研究は、分布外検出の課題に取り組むために、ビジョン言語モデル(VLM)を活用した新しい手法「NegPrompt」を提案している。
主な特徴は以下の通り:
既知のクラスデータのみを使用して、各クラスに対する否定的なプロンプトを学習する。これにより、外部のアウトライアデータに依存せずに、既知クラスと未知クラスの境界を明確化できる。
学習した否定的プロンプトは転移可能であり、訓練時に使用したクラスの一部のみで学習を行っても、未知のクラスに対しても適用できる。これにより、オープンボキャブラリー学習シナリオでも有効に機能する。
様々なImageNetベンチマークでの実験結果から、提案手法「NegPrompt」が既存の最先端のプロンプト学習ベースの分布外検出手法を上回る性能を示すことが確認された。特に、閉じた分類と開いた分類の両方の状況で、高い分布外検出精度を維持できることが明らかになった。
統計
提案手法「NegPrompt」は、既知クラスデータのみを使用して学習を行うことができる。
学習した否定的プロンプトは、未知のクラスに対しても適用可能である。