核心概念
다이얼렉트 특성을 모델링하기 위해 어댑터 모듈을 활용하여 기존 단일 다이얼렉트 언어 모델을 확장하여 세계 영어 언어 모델을 개발하였다.
要約
이 연구는 온디바이스 가상 어시스턴트를 위한 세계 영어 언어 모델을 개발하였다. 기존의 언어, 지역, 기기 의존적인 신경망 언어 모델의 한계를 극복하기 위해, 미국, 영국, 인도 영어 다이얼렉트를 결합하여 세계 영어 언어 모델을 구축하였다.
구체적으로 다음과 같은 내용을 다루었다:
고정 크기 순서 기억 인코딩(FOFE) 기반 언어 모델 아키텍처에 다이얼렉트 특성을 모델링하기 위한 어댑터 모듈을 적용하였다.
어댑터 모듈의 배치 위치와 학습 전략을 실험적으로 분석하였다.
어플리케이션 간 공유 표현을 학습하는 새로운 언어 모델 아키텍처를 제안하였다.
실험 결과, 제안한 언어 모델 아키텍처는 단일 다이얼렉트 모델 대비 정확도를 향상시키면서도 온디바이스 추론 시 요구되는 지연 시간과 메모리 제약을 만족하는 것으로 나타났다. 이를 통해 다이얼렉트 간 공유 표현을 학습하는 세계 영어 언어 모델의 실용성을 확인하였다.
統計
단일 다이얼렉트 모델 대비 제안 모델이 헤드 쿼리에서 평균 1.63%, 테일 엔티티에서 3.72% 정확도 향상
제안 모델의 온디바이스 추론 지연 시간은 단일 다이얼렉트 모델과 유사하며, 최대 지연 시간(P95)에서 40% 개선
引用
"다이얼렉트 특성을 모델링하기 위해 어댑터 모듈을 활용하는 것이 전체 하위 네트워크를 특화시키는 것보다 효과적이다."
"어플리케이션 간 공유 표현을 학습하는 새로운 언어 모델 아키텍처를 통해 정확도와 추론 성능의 균형을 달성할 수 있다."