Główne pojęcia
インドの言語の多様性に着目し、共通ラベルセット(CLS)と音声合成技術を用いて、リソースの少ない言語のゼロショット音声合成と、自然なコードスイッチングを含む音声合成を実現する手法を提案する。
Streszczenie
インド亜大陸における日常会話におけるコードスイッチングとゼロショット音声合成
本稿は研究論文であり、インドにおける音声合成技術、特にリソースの少ない言語への対応と、日常会話で頻繁にみられるコードスイッチングを自然に再現する音声合成について論じている。
インドの多様な言語に対応する音声合成システムを、限られたデータでどのように構築するか。
インドの日常会話で自然に発生するコードスイッチングを、音声合成システムでどのように再現するか。
インドの様々な言語の音素を共通のラベルセット(CLS)にマッピングすることで、単一のシステムで多言語に対応。
音声データの少ない言語に対しては、音韻や文法が類似する言語の合成器を応用し、ゼロショット音声合成を実現。
コードスイッチング音声の合成には、CLSに基づいた統合パーサーを用いて言語の切り替えを検出し、適切な合成器を選択。