แนวคิดหลัก
음성 및 얼굴 정보를 결합한 멀티모달 학습 시스템이 단일 모달리티 시스템보다 개인 식별 및 인증 작업에서 더 뛰어난 성능을 보여주며, 특히 특징 퓨전 전략이 가장 효과적인 것으로 나타났습니다.
บทคัดย่อ
음성-시각적 개인 식별 및 인증 연구 논문 요약
Farhadipour, A., Chapariniya, M., Vukovic, T., & Dellwo, V. (2024). Comparative Analysis of Modality Fusion Approaches for Audio-Visual Person Identification and Verification. arXiv preprint arXiv:2409.00562v2.
본 연구는 음성 및 얼굴 정보를 결합한 멀티모달 학습 시스템을 사용하여 개인 식별 및 인증 작업의 성능을 향상시키는 것을 목표로 합니다. 특히, 서로 다른 모달리티 퓨전 전략(센서 퓨전, 특징 퓨전, 점수 퓨전)을 비교 분석하여 어떤 전략이 가장 효과적인지 밝히고자 합니다.