Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
大規模言語モデルの汎用的聴覚能力の実現
汎用的聴覚能力を持つ大規模言語モデルSALMONN
本論文では、大規模言語モデルにスピーチ、音響イベント、音楽の3つの基本的な音声入力を直接処理・理解する能力を持たせたSALMONNモデルを提案する。
1