Grunnleggende konsepter
限られた学習データ量でも、ゼロショット音声合成において従来のデータ駆動型アプローチに匹敵する性能を達成できる、効率的かつ表現力豊かなゼロショット多言語マルチタスク音声合成システム「MultiVerse」を提案する。
Sammendrag
MultiVerse: 効率的かつ表現力豊かなゼロショット多言語マルチタスク音声合成
Bak, T., Eom, Y., Choi, S., & Joo, Y.-S. (2024). MultiVerse: Efficient and Expressive Zero-Shot Multi-Task Text-to-Speech. arXiv preprint arXiv:2410.03192v1.
本研究は、従来のゼロショット音声合成システムにおける、大規模な学習データセットへの依存という制限に対処するため、効率的かつ表現力豊かなゼロショット多言語マルチタスク音声合成システム「MultiVerse」を提案することを目的とする。