この論文では、社会的なロボットPepperの音声とファンノイズが重なった際に、人間の音声を自動的にフィルタリングする方法に焦点を当てています。実験では、Pepper自体の録音された音声、ファンノイズ、およびPepperマイクで記録された人間の音声から構成されるデータセットを使用しました。信号処理アプローチとCRNNアプローチを比較し、低反響環境で信号処理アプローチが最も優れたパフォーマンスを示す一方、CRNNアプローチは反響に対して堅牢であることがわかりました。しかし、両手法とも改善の余地があります。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Yue Li,Koen ... klo arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.02918.pdfSyvällisempiä Kysymyksiä