本論文は、GAN生成顔を効果的に検出するための新しい手法「ForensicsForest Family」を提案している。
ForensicsForestの主な特徴は以下の通り:
入力特徴抽出: 外観(色ヒストグラム)、周波数(パワースペクトル)、生物学的(顔ランドマーク)特徴を抽出し、入力特徴とする。これにより、画像サイズに依存せずに検出が可能となる。
階層的カスケードフォレスト: 入力特徴を階層的に統合し、各層でパッチごとに特徴を処理・拡張する。これにより、局所と大域の特徴を効果的に学習できる。
マルチスケールアンサンブル: 異なるスケールの特徴を統合することで、さらなる性能向上を実現する。
Hybrid ForensicsForestでは、CNNレイヤーを統合することで特徴表現の精度を高めている。また、Divide-and-Conquer ForensicsForestでは、メモリ使用量を削減しつつ高精度な検出を可能にしている。
提案手法は、StyleGAN、StyleGAN2、StyleGAN3などの最新のGAN生成顔データセットで評価され、CNN系の手法を大きく上回る性能を示している。さらに、ProGAN、StarGAN、LDMなどの他の生成モデルにも適用可能であり、優れた汎化性能を持つことが確認された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Jiucui Lu,Ji... at arxiv.org 04-30-2024
https://arxiv.org/pdf/2308.00964.pdfDeeper Inquiries