核心概念
拡散モデルを使用した高品質な顔偽造データセットを構築し、様々な検出手法の性能を評価することで、顔認証プロセスのセキュリティ向上に貢献する。
要約
本論文では、拡散ベースの顔偽造データセット「DiffusionFace」を提案している。このデータセットは、無条件画像生成、テキストガイド画像生成、イメージガイド画像生成、インペイント、拡散ベースの顔交換アルゴリズムなど、様々な顔偽造手法を網羅している。合計600,000枚の画像が収録されており、高品質な偽造画像と豊富な注釈情報を提供する。
データセットの分析では、周波数領域での特徴分析や、検出モデルの性能評価を行っている。検出モデルの評価では、同一モデル内での検出、モデル間の検出、圧縮・リサンプリングなどの後処理に対する頑健性、トレーニングデータとテストデータが異なる場合の一般化性能など、様々な実世界シナリオを想定している。
結果として、既存の検出手法では拡散ベースの偽造画像に対する検出性能が十分ではないことが明らかになった。このことから、拡散モデルの進化に合わせて、顔認証プロセスのセキュリティを高めるための新たな検出手法の開発が必要であると指摘している。
統計
拡散モデルを用いて生成された顔偽造画像の特徴は、高周波成分の違いが顕著である。
特に、Img2Img、Inpaint、DiffSwap、LDMで生成された画像では、周波数領域での明確な人工物が観察された。