下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
マルチモーダルLLMにおける視覚理解と生成の統合
視覚と言語の統合を実現するマルチモーダルLLMのための自己符号化モーフトークン
マルチモーダルLLMにおける視覚理解と生成の間の矛盾を解決するため、抽象的な視覚プロンプトとしての前処理モーフトークンと、視覚的に完全な後処理モーフトークンを提案する。
1