Core Concepts
이 논문은 2023년 사운드 디믹싱 챌린지의 시네마틱 디믹싱 트랙에 대한 종합적인 요약을 제공합니다. 새로운 숨겨진 데이터셋 CDXDB23을 사용하여 참가자들의 제출 시스템을 평가하였으며, 가장 성공적인 접근법에 대한 통찰을 제공합니다.
Abstract
이 논문은 2023년 사운드 디믹싱 챌린지의 시네마틱 디믹싱 트랙에 대해 자세히 설명합니다.
챌린지 설계:
두 개의 리더보드로 구성됨
Leaderboard A: DnR 데이터셋만 사용
Leaderboard B: 모든 데이터 사용 가능
숨겨진 CDXDB23 데이터셋을 사용하여 제출 시스템 평가
데이터셋:
DnR 데이터셋: 대화, 음악, 효과음으로 구성된 인공 믹스
CDXDB23: 실제 영화 오디오로 구성된 숨겨진 테스트 데이터셋
결과:
Leaderboard A 최고 점수: 4.345 dB (aim-less팀)
Leaderboard B 최고 점수: 8.181 dB (JusperLee팀)
참가자들은 DnR 데이터셋과 CDXDB23 간 분포 차이를 극복하는 데 주력했음
대화 분리 성능은 추가 데이터 활용으로 크게 향상됨
Stats
대화 분리 성능 향상:
"002", "006" 애니메이션 영화에서 큰 향상
"003", "008" 액션 영화에서 큰 향상