Core Concepts
オンラインSpatialNetは、長期ストリーミング音声強化のための優れた性能を提供し、静的および移動話者の両方に対応しています。
Abstract
著者は、過去に提案されたオフラインSpatialNetを拡張し、長期ストリーミングマルチチャンネル音声強化を実現する方法を紹介している。
SpatialNetは、空間情報を活用して目標音声と干渉音を区別し、優れたパフォーマンスを達成する。
オンラインSpatialNetは3つのバリアントで開発されており、短い信号でトレーニングした後に長い信号でファインチューニングする戦略が提案されている。
実験では、提案されたオンラインSpatialNetが他の手法よりも優れた性能を示している。
Quotes
"The proposed online SpatialNets achieve outstanding online speech enhancement performance for long audio streams, and for both static and moving speakers."