Der Artikel stellt eine neue tiefes Lernbasierte Methode zur Lokalisierung und Klassifizierung von Schall-Ereignissen unter Verwendung von Wireless Acoustic Sensor Networks (WASN) vor.
Zunächst wird ein neuartiges Soundmap-Merkmal eingeführt, das die räumliche Verteilung der Energie über mehrere Frequenzbänder hinweg erfasst. Außerdem wird das Gammatonegram-Merkmal verwendet, das besser an die menschlichen Höreigenschaften angepasst ist und sich in Outdoor-Umgebungen als effektiver erwiesen hat.
Darüber hinaus werden Aufmerksamkeitsmechanismen integriert, um kanal-bezogene Beziehungen und zeitliche Abhängigkeiten innerhalb der akustischen Merkmale zu lernen. Das vorgeschlagene Modell kombiniert Convolutional Neural Networks (CNNs) und Transformer-Encoder-Module, um die Schall-Ereignis-Klassifizierung (SEC) und die Schall-Quellen-Lokalisierung (SSL) effektiv zu integrieren.
Die experimentellen Ergebnisse zeigen, dass die vorgeschlagene Methode die Leistung der State-of-the-Art-Methoden bei verschiedenen Rauschpegeln, interferierenden Quellen, Arrays und Quellenpositionierungen übertrifft. Darüber hinaus wird die Effizienz des Systems auch in Realwelt-Experimenten validiert.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Dongzhe Zhan... في arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.20130.pdfاستفسارات أعمق