이 연구는 인공 언어를 활용하여 기계 번역에서 통사적 및 의미적 유사성의 영향을 체계적으로 분석하였다.
첫 번째 실험에서는 동일한 언어 간 번역을 통해 실험 설정이 적절함을 확인하였다.
두 번째 실험에서는 문법이 다른 언어 간 번역 성능을 측정하였는데, 문법 유사성이 높을수록 번역 성능이 향상되었다.
세 번째 실험에서는 어휘가 다른 언어 간 번역을 시도하였는데, 이 경우 번역 성능이 크게 저하되었다.
이후 실험에서는 어휘 간 공통점(앵커 포인트), 단어 빈도 정보, 의미장 정보 등을 추가하여 번역 성능 향상을 시도하였다. 그 결과, 단순한 어휘 및 통사 정보만으로는 충분하지 않으며, 복잡한 의미적 의존성이 비지도 기계 번역의 핵심적인 요인임을 밝혔다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Nicolas Guer... lúc arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18031.pdfYêu cầu sâu hơn