核心概念
문맥 내 예시 선택 시 구문 정보를 활용하면 기계 번역 성능을 향상시킬 수 있다.
摘要
이 논문은 기계 번역을 위한 문맥 내 예시 선택 방법에 대해 다룹니다. 기존 연구들은 단어 수준의 특징만을 고려했지만, 이 연구에서는 구문 정보를 활용하는 새로운 방법을 제안합니다.
구체적으로 다음과 같은 내용을 다룹니다:
- 구문 유사도를 측정하기 위해 의존 구문 트리의 다항식 표현을 사용하는 방법을 소개합니다.
- 단어 수준의 유사도와 구문 수준의 유사도를 결합한 앙상블 방법을 제안합니다.
- 영어와 6개 언어 간 번역 실험을 통해 제안 방법의 우수성을 입증합니다. 11개 번역 방향 중 11개에서 가장 높은 COMET 점수를 달성했습니다.
이 연구는 기계 번역을 위한 문맥 내 예시 선택 시 구문 정보의 중요성을 강조하며, NLP 커뮤니티에 구문 지식의 활용을 촉구합니다.
统计
국제 제재로 인해 새로운 항공기를 구매할 수 없게 되었습니다.
태평양 쓰나미 경보 센터는 쓰나미의 징조가 없다고 밝혔습니다.
引用
"For the first time, we propose a novel syntax-based in-context example selection strategy for MT."
"We present a simple but effective ensemble strategy to combine in-context examples selected from different criteria, taking advantage of both superficial word overlapping and deep syntactic similarity."
"We prove that syntax is effective in finding informative in-context examples for MT. We call on the NLP community not to ignore the significance of syntax when embracing LLMs."