本論文では、顔の偽造検出のための新しいモデルであるBAR-Netを提案している。
まず、1次元のRetNetをイメージデータ処理に適用できるよう2次元化した2D-RetNetを開発した。これにより、画像全体の文脈情報を効率的に捉えることができる。
次に、離散コサイン変換(DCT)によって周波数領域情報を抽出し、バンド注意力調整(BAM)メカニズムを用いて各周波数成分の重要度を動的に調整する。これにより、圧縮によって失われた高周波成分を部分的に復元できる。
最後に、2D-RetNetとBAMを統合したBAR-Netを提案した。実験の結果、BAR-Netは既存の手法を上回る顔偽造検出性能を示し、圧縮された画像に対しても頑健性が高いことが確認された。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Zhida Zhang,... klo arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06022.pdfSyvällisempiä Kysymyksiä