핵심 개념
大規模言語モデルを用いた機械翻訳において、単語アラインメントを指標とした選好学習を用いることで、幻覚や脱落の問題を軽減できる可能性がある。
초록
機械翻訳における単語アラインメントの選好としての活用
本論文は、大規模言語モデル(LLM)を用いた機械翻訳における、幻覚と脱落の問題に取り組んでいます。著者らは、単語アラインメントを指標とした選好学習を用いることで、この問題を軽減できる可能性を示唆しています。
本研究の目的は、LLMベースの機械翻訳モデルにおいて、単語アラインメントに基づく選好学習を用いることで、幻覚と脱落の問題を軽減することです。
著者らは、単語アラインメント選好(WAP)と呼ばれる新しいアプローチを提案しています。WAPは、多様な翻訳の収集、選好データの構築、選好の最適化という3つのステップで構成されています。
多様な翻訳の収集: 複数の既存の翻訳ツールを用いて、多様な翻訳候補を収集します。
選好データの構築: 単語アラインメントモデルを用いて、各翻訳候補の原文に対するカバレッジスコアを予測します。カバレッジスコアが最も高い翻訳を選好翻訳、最も低い翻訳を拒否翻訳として選定し、選好データセットを構築します。
選好の最適化: 構築した選好データセットを用いて、直接選好最適化(DPO)によりLLMベースのMTモデルを最適化します。