Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
3D Vision-Language
3D 場景中的多模態情境推理
本文提出了一個大規模的多模態情境推理資料集 MSQA,並設計了基於該資料集的評估基準,用於評估模型在 3D 場景中理解和推理情境資訊的能力。
1