Kernekoncepter
Band-Attention 조절 RetNet(BAR-Net)은 전역 문맥 정보 포착과 계산 복잡성 간의 균형을 개선하여 효율적으로 광범위한 시각적 문맥을 처리할 수 있습니다.
Resumé
이 논문은 얼굴 위조 탐지를 위한 Band-Attention 조절 RetNet(BAR-Net)을 제안합니다.
- 기존 Transformer 네트워크는 전역 문맥 정보 포착이 중요한 얼굴 위조 탐지에 적합하지만, 계산 복잡성 문제가 있습니다.
- 이를 해결하기 위해 BAR-Net은 다음과 같은 접근법을 사용합니다:
- 2D-RetNet: 이미지 처리에 적합하도록 RetNet을 확장하여 공간 정보를 효과적으로 추출합니다.
- Band Attention Modulation(BAM): DCT 스펙트로그램의 주파수 대역별 가중치를 적응적으로 조절하여 압축으로 인한 고주파 성분 손실을 보완합니다.
- 실험 결과, BAR-Net은 기존 최신 방법들을 능가하는 성능을 보였으며, 특히 고압축 데이터셋에서도 우수한 일반화 능력을 보였습니다.
Statistik
고압축 FF++c40 데이터셋에서 BAR-Net의 AUC는 93.19%로, 기존 최신 방법 대비 3.28% 향상되었습니다.
저압축 FF++c23 데이터셋에서 BAR-Net의 AUC는 99.32%로, 기존 최신 방법 대비 0.08% 향상되었습니다.
Celeb-DF 데이터셋에서 BAR-Net의 AUC는 81.85%로, 기존 최신 방법 대비 2.35% 향상되었습니다.
DFDC 데이터셋에서 BAR-Net의 AUC는 72.42%로, 기존 최신 방법 대비 1.84% 향상되었습니다.
Citater
"Band-Attention 조절 RetNet(BAR-Net)은 전역 문맥 정보 포착과 계산 복잡성 간의 균형을 개선하여 효율적으로 광범위한 시각적 문맥을 처리할 수 있습니다."
"BAM은 DCT 스펙트로그램의 주파수 대역별 가중치를 적응적으로 조절하여 압축으로 인한 고주파 성분 손실을 보완합니다."