Proposing a Multitask Speech Language Model (MSLM) for textless speech-to-speech translation with speaker style preservation.
提案されたMSLMは、テキストレスの音声対音声翻訳において話者のスタイルを保持しながら多言語サポートを可能にします。