本研究では、大規模言語モデル(LLM)を用いてテキストを別言語に音訳し、その音訳テキストをマルチリンガルTTSモデルに入力することで、アクセントの異なる英語音声を合成する手法を提案している。
主な特徴は以下の通り:
実験では、提案手法により生成したアクセント付き音声サンプルを用いて、アクセント変換モデルの性能を大幅に向上させることができた。主観評価と客観評価の両方で、提案手法の有効性が確認された。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Sho Inoue, S... klo arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.09352.pdfSyvällisempiä Kysymyksiä