核心概念
医学専門家が視覚パターンに基づいて意思決定を行う概念ベースモデルは、コンセプト注釈付きデータセットの存在に依存しています。しかし、ビジョン言語モデルを使用することで、コンセプト注釈付きサンプルの数を減らすことが可能です。
要約
この記事では、ビジョン言語モデルを使用して、概念ベース記述をテキスト埋め込みとして使用し、皮膚病変分類の下流タスクに適応する埋め込み学習戦略を提案します。実験結果は、ビジョン言語モデルがコンセプトをテキスト埋め込みとして使用することでより高い精度を達成し、自動コンセプト生成用に特別に設計されたアプローチと同等の性能を達成するために必要なコンセプト注釈付きサンプル数も少なくて済むことを示しています。
統計
1.9
2.0
3.84
1.6
0.15
0.0
2.4
8.66
-0.05
-0.15
引用
"医学専門家が視覚パターンに基づいて意思決定を行う概念ベースモデルは、コンセプト注釈付きデータセットの存在に依存しています。"
"ビジョン言語モデルはコンセプトをテキスト埋め込みとして使用することでより高い精度を達成しました。"
"我々はCLIPモデルの性能向上のための効率的かつ単純な埋め込み学習手法を紹介します。"