本論文は、大規模マルチモーダルプリトレーニングモデル(MM-PTMs)に関する包括的な調査を行っている。
まず、従来の深層学習手法とシングルモーダルのプリトレーニングモデルについて概説する。次に、MM-PTMsの定義、主要な課題、および利点について説明する。
大規模なマルチモーダルデータの収集と前処理、ネットワークアーキテクチャの設計、最適化目的関数の設計、知識強化プリトレーニングなど、MM-PTMsの主要な構成要素について詳しく解説する。
さらに、MM-PTMsの有効性を検証するための下流タスク(生成、分類、回帰)についても紹介する。最後に、MM-PTMsに関する今後の研究方向性を提示する。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Xiao Wang,Gu... alle arxiv.org 04-11-2024
https://arxiv.org/pdf/2302.10035.pdfDomande più approfondite