本論文では、音響シーン分類(ASC)タスクのための新しい軽量ネットワークアーキテクチャを提案している。
まず、log-Melスペクトログラムの高周波数成分と低周波数成分を分離することで、計算量を大幅に削減しつつモデルの性能を維持する手法を提案している。
次に、3つの新しい軽量演算子を設計している:
これらの演算子は、音響シーン分類タスクにおいて効率的な特徴抽出を実現する。
提案手法の実験結果では、従来の深層学習手法と比較して9.8%の性能向上を達成しつつ、パラメータ数と計算量も大幅に削減できることが示されている。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by ShuQi Ye,Yua... a las arxiv.org 05-07-2024
https://arxiv.org/pdf/2405.03567.pdfConsultas más profundas