핵심 개념
オープンソースのマルチモーダル命令データセットの規模と品質の限界が、クローズドソースモデルと比較してパフォーマンスを低下させているという課題に対し、本稿では、厳格な品質フィルタリングと重複排除を通じて強化された、4,000 万サンプルの大規模マルチモーダル命令データセットである Infinity-MM を導入することで、この制限に対処しています。
초록
Infinity-MM:大規模かつ高品質な命令データを用いたマルチモーダル性能の向上
Gu, S., Zhang, J., Zhou, S., Yu, K., Xing, Z., Wang, L., ... & Liu, G. (2024). Infinity-MM: Scaling Multimodal Performance with Large-Scale and High-Quality Instruction Data. arXiv preprint arXiv:2410.18558v1.
オープンソースのマルチモーダル命令データセットの規模と品質の限界を克服し、クローズドソースモデルに匹敵するパフォーマンスを実現することを目指す。