Основні поняття
본 논문에서는 훈련 중에 접하지 못한 공격 유형에 대한 일반화 능력이 떨어지는 기존 음성 딥페이크 탐지 기술의 한계를 극복하기 위해 메타 학습 기반 접근 방식을 제시합니다.
Анотація
보이지 않는 음성 딥페이크 탐지를 개선하기 위한 메타 학습 방식
본 연구는 훈련 중에 접하지 못한 새로운 유형의 음성 딥페이크 공격에 대한 탐지 성능을 향상시키기 위해 메타 학습 기반 접근 방식을 제시합니다. 기존 음성 딥페이크 탐지 시스템은 알려진 공격 유형에 대해서는 높은 성능을 보이지만, 새로운 공격 유형에 대해서는 일반화 능력이 부족하다는 한계를 지니고 있습니다.
본 연구에서는 메타 학습 알고리즘 중 Prototypical Network (ProtoNet)과 Prototypical Networks for Meta-Learning (ProtoMAML)을 활용하여 새로운 음성 딥페이크 공격 유형에 대한 적응 능력을 향상시키는 데 중점을 둡니다. ASVspoof2019 LA 데이터셋을 사용하여 모델을 훈련하고, ASVspoof2019 LA, ASVspoof2021 LA 및 DF, In-The-Wild, FakeAVCeleb 데이터셋을 사용하여 성능을 평가합니다.
ProtoNet
각 클래스의 프로토타입 벡터를 계산하고, 쿼리 샘플을 가장 가까운 프로토타입 벡터를 가진 클래스로 분류합니다.
ProtoMAML
ProtoNet의 개념을 MAML 구조에 통합하여 새로운 작업에 대한 적응 단계를 개선합니다.
새로운 작업에 대한 적응을 위해 모델 매개변수를 미세 조정합니다.