Verbesserung der wissenschaftlichen Verständnis großer Bild-Sprachmodelle durch Multimodal ArXiv.
科学的な理解を向上させるためのMultimodal ArXivデータセットの導入と実験結果を示す。