이 논문은 포인터-생성기 네트워크(PGN)를 Transformer 기반 신경망 기계 번역(NMT) 모델에 적용하여 저자원 기계 번역 성능 향상을 시도했다. 6개의 언어 쌍(hi-mr, hi-bh, es-en, es-ca, fr-de, fr-oc)에 대해 다양한 자원 수준(5k, 15k, 30k, 60k 문장)에서 실험을 진행했다.
실험 결과, PGN 모델은 일부 설정에서 약간의 성능 향상을 보였지만, 기대했던 바와 달리 밀접한 언어 쌍이나 저자원 설정에서 더 큰 이점을 보여주지 않았다. 또한 PGN 모델이 소스-타겟 간 공유 하위 단어를 효과적으로 활용하지 못하는 것으로 나타났다.
이러한 결과의 원인으로 다음과 같은 요인들이 논의되었다:
이러한 분석을 통해 저자원 NMT에 대한 근본적인 과제들이 제기되었다. 특히 Transformer 모델의 블랙박스 특성으로 인해 언어학적 직관을 모델에 효과적으로 반영하기 어려운 문제가 강조되었다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Niyati Bafna... a las arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.10963.pdfConsultas más profundas