本論文では、潜在的再構成誤差(LaRE)と誤差ガイド特徴精製モジュール(EGRE)を組み合わせた新しい手法LaRE2を提案する。LaREは効率的な再構成特徴量で、既存手法に比べて8倍高速である。EGREは、LaREを利用して空間的および特徴量チャンネル的に画像特徴を精製し、生成画像検出の識別性を高める。大規模GenImageベンチマークで、LaRE2は最先端手法に比べて11.9%/12.1%のACC/AP向上を達成した。
単一の簡単なパッチの雑音パターンを活用することで、AI生成画像を効果的に検出できる。
AI生成画像検出技術は進歩しているものの、人間の知覚に挑戦するような、より現実的な画像を判別するには至っておらず、解決には程遠いのが現状である。
本稿では、限られた学習データでも高い汎用性を実現するAI生成画像検出モデル「FAMSeC」を提案する。これは、事前学習済みCLIP:ViTに、LoRAベースのForgery Awareness Module (FAM) とSemantic feature-guided Contrastive learning strategy (SeC) を組み合わせることで、未知の生成モデルに対しても高い精度で真贋判定を行う。