本論文では、モデルの校正を目的とした新しい損失関数を提案している。従来の手法では、正解クラスの確率を最大化するようなアプローチが取られていたが、これには限界がある。特に、予測が間違っているにもかかわらず高い確信度を示す場合などでは、望ましい校正結果が得られない。
提案手法では、正しい予測に高い確信度を、間違った予測に低い確信度を与えることを直接的な目的関数としている。具体的には、正解クラスの確率を1に、誤予測クラスの確率を1/Cに近づけるような損失関数を定義している。ここでCは分類クラス数である。
また、予測の正解性を判断するために、元の入力画像に対して様々な変換を加えた画像の予測結果を利用している。変換後の予測結果の一貫性から、元の入力画像の予測の正解性を推定することができる。
提案手法は、in-distributionおよびout-of-distribution両方のテストデータセットにおいて、既存手法と比べて優れた校正性能を示している。特にout-of-distributionデータセットでの性能が顕著である。これは、提案手法が間違った予測に対して低い確信度を与えることができるためと考えられる。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yuchi Liu,Le... at arxiv.org 04-22-2024
https://arxiv.org/pdf/2404.13016.pdfDeeper Inquiries