Core Concepts
AI生成画像は人間の創造性を模倣し、偽情報の拡散や詐欺などの悪用リスクがある。しかし、人間による識別や自動検出は困難であり、この問題に取り組む必要がある。
Abstract
本論文は、AI生成画像の理解と検出に関する体系的な取り組みを紹介する。
まず、ARIA データセットを収集・共有する。このデータセットには、5つのカテゴリーで合計140,000枚以上の画像が含まれ、人間生成画像とAI生成画像が対になっている。これは、敵対的AI生成画像の研究を支援するための基盤となる。
次に、ユーザー調査を行い、参照画像の有無によって人間がAI生成画像を識別できるかを評価する。その結果、平均正解率は参照ありで68.00%、参照なしで65.24%と、人間による識別は困難であることが示された。
さらに、最新のオープンソースおよび商用AI画像検出器の性能を包括的に評価する。ほとんどの検出器は不十分な性能しか示さず、特にテキストとイメージを組み合わせた生成画像の検出が困難であることが明らかになった。
最後に、ARIAデータセットを使って訓練したResNet-50分類器を紹介し、その精度とモデルの汎化性能を評価する。
Stats
人間生成画像の正解率は79.87%だが、AI生成画像の正解率は61.58%にとどまる。
DALL-E生成画像は人間による識別が最も容易で、正解率は80.7%だった。
自己申告の専門知識と画像識別精度の相関は低く、ほとんどのシナリオで有意ではなかった。
Quotes
"AI生成画像は人間の創造性を模倣し、偽情報の拡散や詐欺などの悪用リスクがある。"
"人間による識別や自動検出は困難であり、この問題に取り組む必要がある。"