本論文では、CLIP-QDAと呼ばれる新しい説明可能な画像分類アルゴリズムを提案している。CLIP-QDAは、CLIP基盤の概念ボトルネックモデル(CBM)からインスピレーションを得ており、各ニューロンが特定の単語に関連付けられた潜在空間を作成する。
CLIP潜在空間をガウス混合モデルでモデル化することで、統計的な値を用いて分類を行うことができる。この定式化により、データセット全体や個別のサンプルに対する説明を提供することができる。
提案手法の経験的な結果は、ガウス混合モデルの仮定が成り立つ場合、CLIP-QDAは既存のCBM手法と同程度の精度を達成することを示している。また、提案する説明手法は既存のXAI手法と競争力があり、計算速度も速い。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies