本論文では、生成画像の自然さを評価するための新しい指標「Anomaly Score」を提案している。
まず、生成画像の表現空間の特性を分析した。生成画像の表現空間は、実画像の表現空間に比べて以下の2つの特徴がある:
複雑さ(complexity): 入力空間の小さな変化に対して、表現空間の変化が非線形になる度合い。実画像の表現空間は複雑であるのに対し、生成画像の表現空間は単純である。
脆弱性(vulnerability): 入力に対する小さな攻撃的な変化によって、特徴量が大きく変化する度合い。実画像の特徴量は攻撃に対して頑健であるのに対し、生成画像の特徴量は脆弱である。
これらの特性を定量化した「Anomaly Score」を提案した。Anomaly Scoreは、実画像と生成画像の複雑さと脆弱性の分布の差を2次元Kolmogorov-Smirnov統計量で測ることで定義される。また、個別の生成画像を評価する「AS-i」も提案した。
実験の結果、提案手法は既存の評価指標よりも人間の知覚に合致した評価ができることが示された。特に、生成モデルの総合的な評価においてはFIDよりも高い相関を示し、個別の生成画像の評価においても既存手法よりも優れた性能を示した。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Jaehui Hwang... klokken arxiv.org 04-10-2024
https://arxiv.org/pdf/2312.10634.pdfDypere Spørsmål