本論文は、深層偽造動画の順次検出に関する新しい手法を提案している。従来の深層偽造検出手法は、最終的な偽造結果を判定するにとどまっていたが、本手法は、顔の各部位に対する改ざん順序を正確に予測することができる。
提案手法の主な特徴は以下の通りである:
質感認識ブランチ: 従来の特徴抽出手法では捉えきれない微細な改ざん痕跡を効果的に抽出するため、多様な質感抽出手法を自己注意機構に統合した質感認識ブランチを導入している。
双方向対話型クロスアテンション: 空間特徴と順序特徴の深い相関関係をモデル化するため、階層的な注意機構を用いた双方向対話型クロスアテンションを提案している。
形状ガイド型ガウシアンマッピング: 改ざんされた顔の各部位の位置情報を事前に学習し、クロスアテンションの効果を高めている。
逆順予測: 改ざんの順序を逆向きに予測することで、各改ざん痕跡の検出精度を段階的に高めている。
実験結果から、提案手法が従来手法を大幅に上回る性能を示すことが確認された。特に、可変長の改ざん系列を正確に予測する指標において顕著な改善が見られた。これは、実用上重要な指標であり、提案手法の有効性を示している。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor