Unduh Linnk AI
•
Asisten Riset
>
Masuk
wawasan
-
マルチモーダルLLMにおける視覚理解と生成の統合
視覚と言語の統合を実現するマルチモーダルLLMのための自己符号化モーフトークン
マルチモーダルLLMにおける視覚理解と生成の間の矛盾を解決するため、抽象的な視覚プロンプトとしての前処理モーフトークンと、視覚的に完全な後処理モーフトークンを提案する。
1