Baixe o Linnk AI
•
Assistente de Pesquisa
>
Entrar
insight
-
最も重要な人物の位置特定と集団コンテキストの理解
マルチモーダル大規模言語モデルによる注釈付きベンチマーク「MIP-GAF」:最も重要な人物の位置特定と集団コンテキストの理解
マルチモーダル大規模言語モデルを使用して、画像内の最も重要な人物の位置と理由を注釈付けした大規模データセット「MIP-GAF」を提案する。
1