이 연구는 Codec-SUPERB라는 종합적인 성능 평가 프레임워크를 소개한다. Codec-SUPERB는 다양한 신경망 기반 오디오 코덱 모델의 성능을 공정하고 포괄적으로 평가할 수 있도록 설계되었다.
Codec-SUPERB는 사용자 친화적인 코드베이스, 커뮤니티 주도의 벤치마크 리더보드, 그리고 정성적으로 선별된 데이터셋과 지표로 구성된다. 이를 통해 코덱 모델의 성능을 신호 수준과 응용 수준에서 종합적으로 분석할 수 있다. 특히 기존 연구들이 주로 신호 수준 지표에 초점을 맞춘 것과 달리, Codec-SUPERB는 응용 수준 지표를 포함하여 코덱 모델의 성능을 다각도로 평가한다.
Codec-SUPERB는 통합 종합 점수를 도입하여 다양한 신호 수준 지표를 효과적으로 결합하고 시각화한다. 이 종합 점수는 개별 지표와 강한 상관관계를 보여 코덱 모델의 전반적인 성능을 잘 반영한다.
또한 Codec-SUPERB는 오픈소스로 공개되어 코덱 개발 커뮤니티의 발전을 촉진할 것으로 기대된다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Haibin Wu, H... lúc arxiv.org 09-19-2024
https://arxiv.org/pdf/2402.13071.pdfYêu cầu sâu hơn