Основні поняття
영어-아일랜드 Covid 데이터의 도메인 적응 기계 번역 모델 개발과 성능 향상의 중요성을 강조합니다.
Статистика
이 연구에서 8k의 도메인 기준 데이터 세트를 5k 줄로 확장하면 BLEU 점수가 27 포인트 향상됨.
Transformer 모델은 2 attention heads로 훈련되었으며, Covid extended 데이터 세트가 가장 높은 BLEU 점수를 보임.
Цитати
"Neural Machine Translation (NMT)은 대규모 병렬 데이터가 있는 경우에 통계 기계 번역 (SMT)보다 우수한 성능을 보입니다." - Crego et al., 2016
"도메인 적응은 저자원 환경에서 데이터 부족 문제를 해결하는 검증된 접근 방식입니다." - Freitag and Al-Onaizan, 2016