Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
マルチモーダル大規模言語モデル評価
複数の画像を扱うマルチモーダル大規模言語モデルの評価:MIBench
既存のマルチモーダル大規模言語モデル (MLLM) は、単一画像タスクでは優れた性能を発揮するものの、複数画像入力になると、きめ細かい認識、複数画像推論、文脈内学習能力など、大きな欠点がある。
1