Core Concepts
画像偽造検出とローカライゼーションのためのFusion Transformerアーキテクチャを紹介し、複数の画像フォレンジック信号を効果的に統合することが重要であることを示した。
Abstract
OMG-Fuserは、任意の数のフォレンジック信号を統合し、画像セマンティクスに基づいて強力なフォレンジック分析を実現する。
フォレンジック信号ストリームとトークンフュージョントランスフォーマーが主要なモジュールであり、それぞれ独自の役割を果たす。
他の手法よりも12.1%から20.4%高いF1値で、7つのデータセットで最先端性能を達成している。
異なる種類の画像操作やニューラルフィルタに対しても堅牢性が示されている。
Stats
我々のネットワークは、7つのデータセットで12.1%から20.4%相対平均改善率を達成しています。