本論文では、人工言語を用いた実験を通して、バックトランスレーションの経験的な成功を生み出す要因を系統的に分析している。
まず、同一の人工言語間でのバックトランスレーションは成功するが、文法が異なる場合は翻訳精度が低下することを示した。さらに、語彙も異なる場合は、バックトランスレーションだけでは翻訳が全く機能しないことを明らかにした。
次に、アンカーワードや語彙の頻度分布の類似性などの要因を検討したが、これらだけでは翻訳精度の向上につながらないことを示した。一方で、少量の教師あり学習データや、単語レベルの辞書情報を加えると翻訳精度が大幅に改善された。
最後に、単純なセマンティックな情報(語彙分野の情報)を加えると、バックトランスレーションの性能が向上することを示した。これらの結果から、言語間の深い意味的な依存関係が、バックトランスレーションの成功の根本にあると考えられる。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies