本研究では、大規模言語モデル(LLM)を用いてテキストを別言語に音訳し、その音訳テキストをマルチリンガルTTSモデルに入力することで、アクセントの異なる英語音声を合成する手法を提案している。
主な特徴は以下の通り:
実験では、提案手法により生成したアクセント付き音声サンプルを用いて、アクセント変換モデルの性能を大幅に向上させることができた。主観評価と客観評価の両方で、提案手法の有効性が確認された。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Sho Inoue, S... alle arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.09352.pdfDomande più approfondite