本研究では、大規模言語モデル(LLM)を用いてテキストを別言語に音訳し、その音訳テキストをマルチリンガルTTSモデルに入力することで、アクセントの異なる英語音声を合成する手法を提案している。
主な特徴は以下の通り:
実験では、提案手法により生成したアクセント付き音声サンプルを用いて、アクセント変換モデルの性能を大幅に向上させることができた。主観評価と客観評価の両方で、提案手法の有効性が確認された。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések