本研究では、大規模言語モデル(LLM)を用いてテキストを別言語に音訳し、その音訳テキストをマルチリンガルTTSモデルに入力することで、アクセントの異なる英語音声を合成する手法を提案している。
主な特徴は以下の通り:
実験では、提案手法により生成したアクセント付き音声サンプルを用いて、アクセント変換モデルの性能を大幅に向上させることができた。主観評価と客観評価の両方で、提案手法の有効性が確認された。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Sho Inoue, S... às arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.09352.pdfPerguntas Mais Profundas