이 논문은 문맥 정보를 활용한 기계 번역 모델의 성능 향상을 위해 공지 정보 예측 모델을 제안한다. 기존 문맥 정보 활용 모델들은 긴 문맥 정보나 복잡한 모델로 인해 중요한 특징을 활용하지 못하는 문제가 있었다. 이를 해결하기 위해 저자들은 번역 결정을 설명하는 공지 정보 예측 모델을 제안했다.
제안 모델은 기존 기계 번역 모델에 공지 정보 예측 모델을 추가로 구축한다. 공지 정보 예측 모델은 번역 출력 표현과 입력 표현을 활용하여 입력 문장의 공지 정보를 예측한다. 이를 통해 번역 모델이 공지 정보를 활용할 수 있도록 한다.
실험 결과, 제안 모델은 영어-러시아, 영어-독일 데이터셋과 다국어 TED 강연 데이터셋에서 기존 문맥 정보 활용 모델 대비 1.0 BLEU 점수 이상 향상된 성능을 보였다. 추가 분석을 통해 공지 정보 예측 모델이 번역 품질 향상에 일관되게 기여함을 확인했다. 또한 공지 정보 예측 모델의 자기 주의 집중 맵이 실제 공지 클러스터와 잘 부합함을 보였다.
To Another Language
from source content
arxiv.org
Głębsze pytania