이 연구는 인공 언어를 활용하여 기계 번역에서 통사적 및 의미적 유사성의 영향을 체계적으로 분석하였다.
첫 번째 실험에서는 동일한 언어 간 번역을 통해 실험 설정이 적절함을 확인하였다.
두 번째 실험에서는 문법이 다른 언어 간 번역 성능을 측정하였는데, 문법 유사성이 높을수록 번역 성능이 향상되었다.
세 번째 실험에서는 어휘가 다른 언어 간 번역을 시도하였는데, 이 경우 번역 성능이 크게 저하되었다.
이후 실험에서는 어휘 간 공통점(앵커 포인트), 단어 빈도 정보, 의미장 정보 등을 추가하여 번역 성능 향상을 시도하였다. 그 결과, 단순한 어휘 및 통사 정보만으로는 충분하지 않으며, 복잡한 의미적 의존성이 비지도 기계 번역의 핵심적인 요인임을 밝혔다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Nicolas Guer... alle arxiv.org 03-28-2024
https://arxiv.org/pdf/2403.18031.pdfDomande più approfondite