이 논문은 포인터-생성기 네트워크(PGN)를 Transformer 기반 신경망 기계 번역(NMT) 모델에 적용하여 저자원 기계 번역 성능 향상을 시도했다. 6개의 언어 쌍(hi-mr, hi-bh, es-en, es-ca, fr-de, fr-oc)에 대해 다양한 자원 수준(5k, 15k, 30k, 60k 문장)에서 실험을 진행했다.
실험 결과, PGN 모델은 일부 설정에서 약간의 성능 향상을 보였지만, 기대했던 바와 달리 밀접한 언어 쌍이나 저자원 설정에서 더 큰 이점을 보여주지 않았다. 또한 PGN 모델이 소스-타겟 간 공유 하위 단어를 효과적으로 활용하지 못하는 것으로 나타났다.
이러한 결과의 원인으로 다음과 같은 요인들이 논의되었다:
이러한 분석을 통해 저자원 NMT에 대한 근본적인 과제들이 제기되었다. 특히 Transformer 모델의 블랙박스 특성으로 인해 언어학적 직관을 모델에 효과적으로 반영하기 어려운 문제가 강조되었다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor