マルチモーダル機械翻訳(MMT)モデルの評価フレームワークに関する論文。MMTの現在の作業はMulti30kテストセットに焦点を当てており、視覚情報の使用が不十分であることが示唆されている。提案されたCoMMuTE評価フレームワークは、視覚情報の使用方法を測定し、複雑な文を翻訳する能力を評価することが重要である。Multi30kテストセットに対してトレーニングされた現在のMMTモデルは、他のテストセットに対してパフォーマンスが低いことが示されている。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Vipin Vijaya... às arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.03014.pdfPerguntas Mais Profundas