이 연구는 지침 미세 조정 및 평가 단계에서 원어 또는 번역 데이터를 사용하여 이러한 문제를 조사한다.
실험 결과, 원어 또는 생성 벤치마크는 특히 모델 성능이 높을 때 원어와 번역 지침 데이터 간의 상당한 차이를 드러내는 반면, 다른 유형의 테스트 세트는 그렇지 않다.
왕복 번역과 단일 통과 번역 간의 비교는 언어별 자원의 지식이 중요함을 보여준다.
구조화된 작업에서는 정규화가 이 격차를 해소하는 데 도움이 되지만, 생성 작업에서는 그렇지 않다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Pinzhen Chen... في arxiv.org 09-27-2024
https://arxiv.org/pdf/2406.12822.pdfاستفسارات أعمق