Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
高解像度および文字情報豊富な画像に対する推論の効率的なグラウンディング
高解像度および文字情報豊富な画像に対する推論の効率的なグラウンディング
マルチモーダル大規模言語モデルの推論能力を向上させるため、外部エージェントを活用してテキストや視覚的な手がかりを即座に得る新しい枠組みを提案する。
1