이 연구는 오픈소스 기반 음성 모델 개발을 위한 첫 단계로, EU 24개 공식 언어에 대한 950,000시간의 음성 데이터를 수집하였다. 이를 위해 기존 음성 인식 데이터셋과 무레이블 음성 코퍼스 중 오픈소스 라이선스 하에 공개된 자료를 조사하였다. 또한 441,000시간의 무레이블 데이터에 대해 자동 전사본을 생성하여 CC-BY 라이선스로 공개하였다. 이를 통해 EU 언어에 대한 오픈소스 음성 기반 모델 개발을 촉진할 수 있을 것으로 기대된다. 말타어에 대한 실험 결과, 수집된 데이터를 활용하여 효과적인 음성 인식 모델을 학습할 수 있음을 확인하였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
핵심 통찰 요약
by Marco Gaido,... 게시일 arxiv.org 10-03-2024
https://arxiv.org/pdf/2410.01036.pdf더 깊은 질문