非ネイティブ話者の発音を改善するだけでなく、アクセント変換も行う新しいアクセント変換(AC)アプローチを開発した。
本論文では、制御可能なアクセント付き音声合成(TTS)を用いて合成された並列データを用い、離散ユニットに基づく新しいアクセント変換(AC)システムを提案しています。
本研究では、多レベルVAEと敵対的学習を組み合わせたモデルを提案し、テキスト・トゥ・スピーチにおけるアクセント変換の性能を向上させる。
本研究では、大規模言語モデルを用いたテキスト音訳によりアクセントを持つ音声サンプルを自動生成する手法を提案する。この手法により、アクセント変換システムの学習に有効な並列データセットを構築できる。