マルチモーダル機械翻訳(MMT)モデルの評価フレームワークに関する論文。MMTの現在の作業はMulti30kテストセットに焦点を当てており、視覚情報の使用が不十分であることが示唆されている。提案されたCoMMuTE評価フレームワークは、視覚情報の使用方法を測定し、複雑な文を翻訳する能力を評価することが重要である。Multi30kテストセットに対してトレーニングされた現在のMMTモデルは、他のテストセットに対してパフォーマンスが低いことが示されている。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Vipin Vijaya... lúc arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.03014.pdfYêu cầu sâu hơn