Core Concepts
ラベルノイズを含む検証セットを用いてコンフォーマル予測を行う際に、ノイズに強いコンフォーマルスコアを提案する。提案手法は、ノイズレベルを考慮して正解ラベルのスコアを推定し、それに基づいて予測セットを構築する。
Abstract
本研究では、医療画像分類タスクにおいて、検証セットにラベルノイズが存在する場合のコンフォーマル予測の問題に取り組む。
まず、標準的なコンフォーマル予測(CP)アルゴリズムをノイズラベルデータに適用する方法(Noisy-CP)について説明する。この方法では、ノイズの影響により、予測セットのサイズが大きくなる問題がある。
そこで本研究では、ラベルノイズに頑健なコンフォーマルスコアを提案する。ノイズレベルを考慮して正解ラベルのスコアを推定し、それに基づいて予測セットを構築する手法(NR-CP)を提案する。
提案手法を医療画像分類データセットに適用した結果、Noisy-CPや既存の手法に比べて、予測セットのサイズを大幅に小さくしつつ、所定の信頼度を維持できることを示した。また、ノイズレベルの推定と組み合わせることで、ノイズレベルが高い場合でも良好な性能が得られることを確認した。
Stats
正解ラベルyの予測スコアS(x, y)は、ノイズラベル ˜
yを用いて以下のように推定できる:
ˆ
S(x, ˜
y, ϵ) = (1−ϵ)S(x, ˜
y) + ϵS(x)
ノイズレベルϵが高いほど、予測セットのサイズが大きくなる傾向がある。
Quotes
"医療画像分類タスクでは、最も可能性の高い診断を報告するだけでなく、他の可能性を排除することも重要である。"
"検証セットにノイズラベルが含まれる場合、ノイズの影響によりCPのしきい値が高くなり、予測セットのサイズが大きくなる問題がある。"