Core Concepts
大規模マルチモーダルモデルを使って、AI生成の偽画像を検出し、その理由を説明することができる。
Abstract
本論文は、AI生成の偽画像の検出と分析に関する新しいベンチマーク「FakeBench」を提案している。FakeBenchは、大規模マルチモーダルモデル(LMM)の偽画像検出能力、推論能力、解釈能力、オープンクエスチョン回答能力の4つの側面を評価する。
FakeClassデータセットでは、6,000枚の偽画像と本物の画像を用意し、画像の真偽を問う質問に答えさせる。FakeClueデータセットでは、3,000枚の偽画像に対して、人間とGPTが協力して作成した15,000個の偽画像の特徴説明を用意し、LMMsの推論能力と解釈能力を評価する。FakeQAデータセットでは、54,000個の画像の細かな真偽に関する質問に答えさせることで、LMMsのオープンクエスチョン回答能力を評価する。
実験の結果、現在のLMMsは偽画像検出能力、推論能力、解釈能力、オープンクエスチョン回答能力のいずれも初期段階にあることが分かった。特に、推論能力と解釈能力は検出能力よりも劣っており、細かな真偽判断に関する質問への回答能力も低い。今後、LMMsの透明性の高い偽画像検出能力の向上が期待される。
Stats
この画像は晴れた日に撮影されたと考えられる。
水中の鯨の体の一部が日光に照らされ、影が見られる。
鯨は水面から離れて潜っているように見える。