マルチモーダル機械翻訳(MMT)モデルの評価フレームワークに関する論文。MMTの現在の作業はMulti30kテストセットに焦点を当てており、視覚情報の使用が不十分であることが示唆されている。提案されたCoMMuTE評価フレームワークは、視覚情報の使用方法を測定し、複雑な文を翻訳する能力を評価することが重要である。Multi30kテストセットに対してトレーニングされた現在のMMTモデルは、他のテストセットに対してパフォーマンスが低いことが示されている。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Vipin Vijaya... alle arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.03014.pdfDomande più approfondite