マルチモーダル機械翻訳(MMT)モデルの評価フレームワークに関する論文。MMTの現在の作業はMulti30kテストセットに焦点を当てており、視覚情報の使用が不十分であることが示唆されている。提案されたCoMMuTE評価フレームワークは、視覚情報の使用方法を測定し、複雑な文を翻訳する能力を評価することが重要である。Multi30kテストセットに対してトレーニングされた現在のMMTモデルは、他のテストセットに対してパフォーマンスが低いことが示されている。
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Vipin Vijaya... о arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.03014.pdfГлибші Запити