ดาวน์โหลด Linnk AI
•
ผู้ช่วยวิจัย
>
ลงชื่อเข้าใช้
ข้อมูลเชิงลึก
-
最も重要な人物の位置特定と集団コンテキストの理解
マルチモーダル大規模言語モデルによる注釈付きベンチマーク「MIP-GAF」:最も重要な人物の位置特定と集団コンテキストの理解
マルチモーダル大規模言語モデルを使用して、画像内の最も重要な人物の位置と理由を注釈付けした大規模データセット「MIP-GAF」を提案する。
1