本論文では、クロード3 Opusの機械翻訳能力を調査した。主な発見点は以下の通り:
クロードは、FLORES-200ベンチマークでは他のLLMよりも優れた翻訳性能を示すが、データ汚染の可能性が示唆された。
新たに作成したBBC Newsデータセットを用いた評価では、クロードが多くの言語ペアで最先端の翻訳システムを上回ることが分かった。特に、低リソース言語ペアでの翻訳性能が優れていた。
クロードの翻訳能力は英語への翻訳の方が英語からの翻訳よりも高い。しかし、クロードは他のLLMと比べて言語リソースレベルに依存しない優れた資源効率性を示した。
クロードの翻訳能力を活用して、低リソース言語ペアのヨルバ語-英語翻訳モデルを構築した。この手法により、既存の最先端モデルを上回る性能を達成した。
以上の結果から、LLMであるクロードが低リソース機械翻訳の高度化に寄与できる可能性が示された。今後は、クロードの能力を活用した翻訳モデルの最適化や、非英語中心の言語ペアへの適用などが期待される。
To Another Language
from source content
arxiv.org
Дополнительные вопросы