이 논문은 Iu Mien 언어에 대한 음성 인식 모델 구축을 위해 다양한 사전 학습 방법을 탐구하고 비교한다. Iu Mien 언어는 중국 남부 지역의 소수 민족 언어로, 음성 및 언어 자원이 매우 부족한 실정이다.
논문에서는 세 가지 사전 학습 방법을 비교한다:
실험 결과, 음소 단위 감독 학습 기반 사전 학습 모델인 Whistle이 가장 우수한 성능을 보였다. 이는 음소 단위 사전 학습이 다국어 간 발음 지식을 효과적으로 공유할 수 있어, 제한된 Iu Mien 언어 데이터로도 좋은 성능을 달성할 수 있음을 보여준다.
향후 연구 방향으로는 다국어 사전 학습 시 성조 정보를 통합하는 방법을 고려할 수 있다. Iu Mien 언어는 8개의 성조를 가지고 있어, 성조 모델링이 추가로 필요할 것으로 보인다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Lukuan Dong,... lúc arxiv.org 09-17-2024
https://arxiv.org/pdf/2407.13292.pdfYêu cầu sâu hơn