Core Concepts
深層学習を用いて、背景ノイズ、音声符号化、伝送チャネルの影響を同時に低遅延で処理し、高品質な音声通信を実現する。
Abstract
本研究では、低遅延の音声伝送と強化を同時に行うための新しい手法を提案している。
音声強化のためにConv-TasNetアーキテクチャを、音声伝送のためにTransNetアーキテクチャを使用する。
2つのシステムを単純に連結する方法と、エンドツーエンドで共同学習する方法の2つを提案している。
様々な伝送帯域幅、無線チャネルSNR、遅延条件下で、共同学習の方が単純な連結よりも優れた性能を示す。
特に低帯域幅や低SNR条件下で、共同学習の方が大きな性能改善を示す。
提案手法は、ワイヤレスの補聴器などの低遅延音声通信アプリケーションに適用できる。
Stats
提案手法の総遅延は3 msまで設定可能
単独のConv-TasNetシステムの性能は上限を示す
単独のTransNetシステムの性能は下限を示す
共同学習の方が単純な連結よりも全ての指標で優れた性能を示す
Quotes
"提案手法は、背景ノイズ、音声符号化、伝送チャネルの影響を同時に低遅延で処理し、高品質な音声通信を実現する。"
"共同学習の方が単純な連結よりも、特に低帯域幅や低SNR条件下で大きな性能改善を示す。"
"提案手法は、ワイヤレスの補聴器などの低遅延音声通信アプリケーションに適用できる。"