本論文では、マルチモーダル大規模言語モデルの編集に焦点を当てている。単一モーダルのモデル編集に比べ、マルチモーダルのモデル編集はより困難であり、編集プロセスでより高度な精査と慎重な検討が求められる。
この分野の研究を促進するため、新しいベンチマーク「MMEdit」を構築した。MMEditには2つのサブタスクがある:VQAの編集(E-VQA)とイメージキャプショニングの編集(E-IC)。ベンチマークでは、信頼性、局所性、一般性の3つの評価指標を導入している。
様々なモデル編集手法を包括的に実験した結果、従来の手法でもマルチモーダルモデルの編集は一定程度可能だが、その効果はまだ十分とは言えず、この課題の難しさを示唆している。特に、ビジョンモジュールの編集は言語モジュールの編集よりも困難であることが分かった。
本研究は、マルチモーダル大規模言語モデルの編集に関する洞察を提供し、この分野の研究を促進することを目的としている。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Siyuan Cheng... pada arxiv.org 04-19-2024
https://arxiv.org/pdf/2310.08475.pdfPertanyaan yang Lebih Dalam