本論文は、ドイツ語とバイエルン語の機械翻訳システムの開発に取り組んでいる。低リソース言語であるバイエルン語に対して、以下の取り組みを行っている:
評価には、BLEU、chrF、TERの3つの指標を組み合わせて用いる。統計的有意性検定の結果、バックトランスレーションによる大幅な性能向上が確認された。一方で、Transfer Learningによる効果は限定的であった。
言語の類似性が機械翻訳の精度に大きく寄与することが示唆された。また、バイエルン語の方言の違いや正書法の不統一など、低リソース言語特有の課題も明らかになった。今後は、より精度の高い機械翻訳システムの構築に向けて、高品質な平行コーパスの構築や、方言の識別などに取り組む必要がある。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Wan-Hua Her,... at arxiv.org 04-15-2024
https://arxiv.org/pdf/2404.08259.pdfDeeper Inquiries