All-Seeing Project V2は、画像内のオブジェクト間の関係を理解するために新しいモデルとデータセットを提案しています。ASMv2は、他の主要なMLLMよりも強力な関係理解能力を示し、Open-ended Scene Graph Generationタスクで最先端のパフォーマンスを達成しています。CRPEベンチマークでは、ASMv2が他のモデルよりも優れた関係理解能力を示しています。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Weiyun Wang,... ที่ arxiv.org 03-01-2024
https://arxiv.org/pdf/2402.19474.pdfสอบถามเพิ่มเติม