Khái niệm cốt lõi
본 연구는 코드 전환된 세페디-영어 자동 음성 인식 시스템의 성능을 평가하였다. 이 엔드-투-엔드 시스템은 세페디 프롬프트 코드 전환 코퍼스와 CTC 접근법을 사용하여 개발되었다. 시스템의 성능은 NCHLT 세페디 테스트 코퍼스와 세페디 프롬프트 코드 전환 코퍼스를 사용하여 평가되었다. 모델은 41.9%의 가장 낮은 WER을 산출했지만, 세페디 전용 텍스트 인식에 어려움을 겪었다.
Tóm tắt
이 연구는 코드 전환된 세페디-영어 자동 음성 인식 시스템의 성능을 평가하였다.
- 세페디 프롬프트 코드 전환(SPCS) 코퍼스와 NCHLT 세페디 코퍼스를 사용하여 시스템을 개발하고 평가했다.
- 모델 구성은 엔드-투-엔드 접근법을 따랐으며, 3개의 RNN 레이어와 2개의 CNN 레이어로 구성되었다.
- 필터 수를 16, 32, 64개로 변경하여 성능을 비교했다.
- 16개의 필터를 사용했을 때 가장 낮은 WER 41.9%를 달성했다.
- NCHLT 테스트 데이터에서는 성능이 낮았는데, 이는 훈련 데이터와의 도메인 차이로 인한 것으로 보인다.
- 코드 전환 음성 인식은 여전히 과제이며, 다양한 데이터로 모델을 개선할 필요가 있다.
Thống kê
세페디 전용 텍스트에 대한 WER은 50.05%였다.
32개 필터를 사용했을 때 NCHLT 테스트 데이터의 WER은 85.06%였다.
64개 필터를 사용했을 때 NCHLT 테스트 데이터의 WER은 89.89%였다.
Trích dẫn
"모델은 세페디 전용 텍스트 인식에 어려움을 겪었다."
"NCHLT 테스트 데이터에서 성능이 낮은 것은 훈련 데이터와의 도메인 차이로 인한 것으로 보인다."