Download Linnk AI
•
Research Assistant
>
Sign In
insight
-
マルチモーダルLLMにおける視覚理解と生成の統合
視覚と言語の統合を実現するマルチモーダルLLMのための自己符号化モーフトークン
マルチモーダルLLMにおける視覚理解と生成の間の矛盾を解決するため、抽象的な視覚プロンプトとしての前処理モーフトークンと、視覚的に完全な後処理モーフトークンを提案する。
1