Centrala begrepp
視覚言語タスクの学習によって生じる大規模言語モデルの言語能力低下は、継続学習の手法を用いることで効果的に軽減できる。
Sammanfattning
継続学習を用いたマルチモーダル大規模言語モデルの改善
この研究論文は、マルチモーダル大規模言語モデル (MLLM) における、特に視覚言語タスクの学習による言語能力の低下という課題と、その解決策としての継続学習の可能性について論じています。
視覚言語タスクの学習が、既存の言語能力に与える影響を調査する。
継続学習の手法を用いることで、言語能力の低下を軽減できるかを検証する。
9種類のLLM (Pythia, Phi2, LLaMA 2) を用い、LLaVAを用いてMLLMを学習。
言語能力の低下を測定し、継続学習手法 (LoRA, Soft Targets, Rehearsal, mSGM) の有効性を評価。
言語能力と視覚言語タスクの精度を比較し、各手法の影響を分析。