核心概念
人間の認知発達から着想を得た、限られたデータ条件下でのビジョン言語モデルの自己合成学習アプローチを紹介する。
要約
ビジョン言語モデルの自己合成学習:発達的に妥当なデータを用いたアプローチ
本稿は、人間の認知発達に着想を得た、限られたデータ条件下でのビジョン言語モデルの自己合成学習アプローチを提案する研究論文である。
AlKhamissi, B., Tang, Y., Gökce, A., Mehrer, J., & Schrimpf, M. (2024). Dreaming Out Loud: A Self-Synthesis Approach For Training Vision-Language Models With Developmentally Plausible Data. arXiv preprint arXiv:2411.00828v1.
本研究は、従来の大規模言語モデルの学習に必要な膨大なデータ量と、人間の言語獲得におけるデータ効率性の差に着目し、発達的に妥当なデータ量でのビジョン言語モデルの学習を目的とする。