Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
マルチモーダルLLMにおける視覚理解と生成の統合
視覚と言語の統合を実現するマルチモーダルLLMのための自己符号化モーフトークン
マルチモーダルLLMにおける視覚理解と生成の間の矛盾を解決するため、抽象的な視覚プロンプトとしての前処理モーフトークンと、視覚的に完全な後処理モーフトークンを提案する。
1