상파울루 지역의 자발적 발화 데이터셋을 활용하여 자동 음성 인식 모델의 성능을 평가하고 개선하고자 한다.
개체 설명을 활용하여 자동 음성 인식 시 발생하는 개체명 오류를 효과적으로 해결할 수 있는 모델을 제안한다.
본 연구는 코드 전환된 세페디-영어 자동 음성 인식 시스템의 성능을 평가하였다. 이 엔드-투-엔드 시스템은 세페디 프롬프트 코드 전환 코퍼스와 CTC 접근법을 사용하여 개발되었다. 시스템의 성능은 NCHLT 세페디 테스트 코퍼스와 세페디 프롬프트 코드 전환 코퍼스를 사용하여 평가되었다. 모델은 41.9%의 가장 낮은 WER을 산출했지만, 세페디 전용 텍스트 인식에 어려움을 겪었다.
SpeechColab Leaderboard는 다양한 자동 음성 인식 시스템의 성능을 공정하고 재현 가능한 방식으로 평가하기 위한 일반 목적의 오픈소스 플랫폼이다.