이 논문은 저자 자원이 부족한 언어에 대한 신경망 기계 번역 기술을 조사하였다. 바이에른어와 독일어 간 양방향 신경망 기계 번역 시스템을 개발하고 평가하였다.
먼저 베이스라인 모델을 훈련하였다. 이후 데이터 증강 기법인 역번역을 적용하여 성능을 향상시켰다. 또한 독일어-프랑스어 모델을 활용한 전이 학습 실험을 수행하였다.
평가 지표로 BLEU, chrF, TER를 사용하였다. 통계적 유의성 분석 결과, 베이스라인 모델의 성능이 상당히 높았으며 역번역이 유의미한 성능 향상을 가져왔다. 반면 전이 학습은 베이스라인과 역번역 모델에 미치지 못하였다.
저자 자원이 부족한 언어 간 유사성이 높은 경우 번역 성능이 우수하다는 점을 확인하였다. 또한 역번역이 저자 자원이 부족한 언어 번역에 효과적임을 보였다. 그러나 전이 학습은 기대만큼의 성능 향상을 보이지 않았다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문