المفاهيم الأساسية
문맥 정보를 더 효과적으로 활용하여 희귀 단어 인식 성능을 향상시키는 Deep CLAS 모델을 제안한다.
الملخص
이 논문은 희귀 단어 인식 성능을 향상시키기 위해 Deep CLAS 모델을 제안한다. 기존의 CLAS 모델은 문맥 정보를 충분히 활용하지 못하는 문제가 있었다. 이를 해결하기 위해 다음과 같은 개선 사항을 제안했다:
- 편향 손실(bias loss)을 도입하여 모델이 문맥 정보에 집중하도록 한다.
- 이전 출력 단어, 현재 음향 정보 등을 편향 주목 쿼리에 추가하여 편향 주목 점수의 정확도를 높인다.
- 단어 단위가 아닌 문자 단위로 문맥 정보를 인코딩하여 세부적인 문맥 정보를 활용한다.
- 편향 주목 점수를 출력 확률 분포에 직접 반영하여 문맥 정보를 더 효과적으로 사용한다.
- 접두사 트리를 활용하여 관련 없는 편향 단어의 간섭을 줄인다.
실험 결과, 이러한 개선 사항들을 통해 CLAS 대비 65.78% 상대 recall 향상, 53.49% 상대 F1 점수 향상을 달성했다.
الإحصائيات
편향 단어 목록에 포함된 단어를 정확하게 인식하는 것이 중요하다.
편향 단어 목록에 포함된 단어를 잘 인식하면 전체 인식 성능이 크게 향상된다.
اقتباسات
"CLAS는 문맥 정보를 충분히 활용하지 못하는 문제가 있었다."
"편향 손실을 도입하여 모델이 문맥 정보에 집중하도록 했다."
"문자 단위 인코딩을 통해 세부적인 문맥 정보를 활용할 수 있었다."