本論文では、画像認識モデルの堅牢性を評価するための新しいデータセット「XIMAGENET-12」を提案している。XIMAGENET-12は、ImageNetから12のカテゴリを選択し、背景のぼかし、色変化、背景置換など、実世界の状況を模擬した6つのシナリオを含んでいる。合計で20万枚以上の画像から成る。
論文では、XIMAGENET-12を用いて、代表的な画像認識モデルの堅牢性を評価している。その結果、モデルの正確度と堅牢性は必ずしも相関せず、背景の変化に特に脆弱であることが明らかになった。また、セグメンテーションモデルの評価にも有効であることを示している。
XIMAGENET-12は、画像認識モデルの実世界での性能を正確に評価し、改善するための重要なツールとなることが期待される。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Qiang Li,Dan... at arxiv.org 04-19-2024
https://arxiv.org/pdf/2310.08182.pdfDeeper Inquiries