Core Concepts
VLMの零距離推論機能を活用し、ラベル付きデータを必要としない病理画像分類手法を提案する。VLMの特徴表現能力を利用して擬似ラベルを生成し、それらの一致度に基づいて信頼できるサンプルを選別する。さらに、選別されたサンプルと未ラベル化サンプルを組み合わせて学習する手法を提案する。
Abstract
本研究では、人手アノテーションを必要としない病理画像分類手法VLM-CPLを提案している。
まず、VLMの零距離推論機能を利用して、トレーニングデータに対する擬似ラベルを生成する。しかし、VLMの事前学習データとターゲットデータの間のドメインギャップにより、生成された擬似ラベルにはノイズが含まれる可能性がある。
そこで、VLMの特徴表現能力を活用し、クラスタリングに基づく別の種類の擬似ラベルを生成する。トレーニングサンプルについて、これら2種類の擬似ラベルの一致度に基づいて信頼できるサンプルを選別する。
最後に、選別されたサンプルと未ラベル化サンプルを組み合わせて、High-confidence Cross Supervisionを用いて最終モデルを学習する。
実験の結果、提案手法は既存の零距離推論手法や教師あり学習手法と比べて大幅な精度向上を示した。
Stats
提案手法は、HPHデータセットで87.1%、LC25Kデータセットで95.1%の分類精度を達成した。
PLIPの零距離推論と比べ、HPHデータセットで22.6ポイント、LC25Kデータセットで24.2ポイントの精度向上を示した。