핵심 개념
本研究は、パラメータ効率的な方法でグローバルな特徴とローカルな特徴を同時に抽出することで、顔偽造検出の一般化性と頑健性を向上させる。
초록
本研究は、顔偽造検出のための新しいアプローチMoE-FFDを提案する。MoE-FFDは、ViTバックボーンに軽量なLoRAレイヤーとAdapterレイヤーを統合することで、パラメータ効率的な学習を実現する。
具体的には以下の特徴がある:
- ViTバックボーンの重みを凍結したまま、LoRAとAdapterの外部モジュールのみを更新することで、ImageNetの知識を保持しつつ偽造特徴を適応的に学習する。
- LoRAレイヤーはグローバルな特徴を、Adapterレイヤーはローカルな特徴を抽出し、両者の長所を活かすことで一般化性と頑健性を向上させる。
- 新しいMoEモジュールを導入し、入力に応じて最適なLoRAとAdapterの専門家を動的に選択することで、検出性能をさらに高める。
実験の結果、MoE-FFDは既存手法と比べて一般化性と頑健性が大幅に向上し、パラメータ数も大幅に削減できることが示された。
통계
顔偽造検出は、ディープフェイクの急速な普及により重要な課題となっている。
従来のCNN手法は局所的な特徴しか捉えられず、一般化性が限られていた。
ViT手法は表現力に優れるが、計算コストが高く、局所的な特徴を捉えるのが苦手だった。
인용구
"ディープフェイクの急速な普及により、社会的な信頼問題と安全上の懸念が高まっている。"
"ViT手法は表現力に優れるが、計算コストが高く、局所的な特徴を捉えるのが苦手だった。"