이 연구는 볼로프어로 구현된 최초의 자동 음성 어시스턴트 개발 방법론을 제시합니다. 각 모듈의 설명과 함께 음성 인식(ASR) 및 자연어 이해(NLU) 작업에 대한 초기 결과를 제공합니다.
볼로프어는 세네갈에서 가장 널리 사용되는 언어이지만, 디지털 리소스가 매우 부족한 언어입니다. 이 연구는 이러한 저자원 언어에 대한 주요 과제를 나열하고 있습니다.
음성 인식 모듈은 Kaldi 도구를 사용하여 구현되었습니다. 44시간의 음성 데이터와 2백만 단어의 언어 모델을 사용하여 학습되었습니다. 이를 통해 22%의 단어 오류율(WER)을 달성했습니다.
자연어 이해 모듈은 Rasa 프레임워크를 사용하여 구현되었습니다. 184개의 발화로 구성된 데이터셋을 사용하여 학습되었으며, 78%의 F1 점수를 달성했습니다.
음성 응답은 사전 녹음된 오디오 메시지로 제공됩니다. 실제 사용자 테스트에서는 음성 인식 성능이 낮았지만, 자연어 이해 모듈은 상대적으로 잘 일반화되었습니다. 향후 더 많은 데이터와 개선된 모델을 통해 성능을 높일 계획입니다.
Іншою мовою
із вихідного контенту
arxiv.org
Глибші Запити