toplogo
Ressourcen
Anmelden

Vergleich der Leistung von Spektrogramm und Scalogramm als Eingabe für die akustische Erkennungsaufgabe


Kernkonzepte
Vergleich der Leistung von Spektrogramm und Scalogramm für die akustische Erkennungsaufgabe.
Zusammenfassung
Inhaltsverzeichnis: Einleitung zur akustischen Erkennung Theoretische Grundlagen von STFT und WT Methodik der Studie Benchmarking und Leistungsbewertung Schlussfolgerung und zukünftige Arbeit Hauptpunkte: Vergleich von Spektrogramm und Scalogramm für akustische Erkennung Anwendung von CNNs für die Klassifizierung von normalen und abnormen Geräuschen Unterschiede in der Leistung je nach Maschinentyp Computational Expense: Scalogramm erfordert mehr Rechenleistung als Spektrogramm Modellevaluation: Spektrogramm übertrifft Scalogramm in den meisten Fällen Erkenntnisse: Spektrogramm und Scalogramm bieten unterschiedliche Leistungen je nach Art des Audiosignals. Die Normalisierung der Audiosignale verbessert die Sichtbarkeit von Spektrogramm und Scalogramm. Scalogramm kann bei nicht-stationären Signalen besser abschneiden, während Spektrogramm bei stationären Signalen überlegen ist.
Statistiken
STFT ist eine Methode zur Durchführung der Fourier-Transformation in Abschnitten der Zeit. Die Größe der Ausgabematrix nach STFT beträgt (513, 313) für 160.000 Samples pro Signal. CWT wird in diskreter Weise durchgeführt, wobei die Skala ein Bereich aufeinanderfolgender natürlicher Zahlen ist.
Zitate
"Die Normalisierung der Audiosignale verbessert die Sichtbarkeit von Spektrogramm und Scalogramm." "Scalogramm kann bei nicht-stationären Signalen besser abschneiden, während Spektrogramm bei stationären Signalen überlegen ist."

Tiefere Untersuchungen

Wie beeinflusst die Stationarität von Signalen die Leistung von Spektrogramm und Scalogramm?

Die Stationarität von Signalen hat einen signifikanten Einfluss auf die Leistung von Spektrogramm und Scalogramm. Bei stationären Signalen, die über die Zeit hinweg konstante statistische Eigenschaften aufweisen, wie beispielsweise der Klang eines Ventilators, tendiert das Spektrogramm dazu, bessere Leistungen zu erbringen als das Scalogramm. Dies liegt daran, dass das Spektrogramm eine konstante Zeit- und Frequenzauflösung bietet, was bei stationären Signalen effektiv ist, um Merkmale zu extrahieren und Muster zu erkennen. Im Gegensatz dazu, bei nicht-stationären Signalen wie impulsiven und spärlichen Geräuschen, wie sie bei Ventilen auftreten können, kann das Scalogramm aufgrund seiner Multiskalenfähigkeit und der Fähigkeit, Merkmale von nicht-stationären Signalen besser zu extrahieren, möglicherweise bessere Ergebnisse liefern.

Welche anderen Normalisierungstechniken könnten die Robustheit der Ergebnisse verbessern?

Neben der im Kontext erwähnten Normalisierungstechnik, die die Amplitude der Audiosignale auf den Bereich [0, 1] begrenzt, könnten auch andere Normalisierungstechniken die Robustheit der Ergebnisse verbessern. Eine Möglichkeit wäre die Normalisierung durch Verschiebung des Mittelwerts auf Null und der Standardabweichung auf Eins. Diese Technik könnte dazu beitragen, die Verteilung der Daten zu zentrieren und zu skalieren, was die Modellleistung verbessern und die Konvergenz beschleunigen könnte. Eine weitere Technik könnte die Normalisierung durch Min-Max-Skalierung sein, bei der die Daten auf einen definierten Wertebereich skaliert werden, beispielsweise von -1 bis 1. Diese Technik könnte dazu beitragen, Ausreißer zu reduzieren und die Stabilität des Modells zu verbessern.

Inwiefern könnte die Entwicklung einer Bibliothek für CWT mit einem einstellbaren Translationsparameter die Vergleichbarkeit von STFT und WT verbessern?

Die Entwicklung einer Bibliothek für Continuous Wavelet Transform (CWT) mit einem einstellbaren Translationsparameter könnte die Vergleichbarkeit von Short-time Fourier Transform (STFT) und WT verbessern, indem sie die Ausgabe der beiden Transformationen auf eine ähnliche Größe standardisiert. Der Translationsparameter in der CWT ermöglicht es, die Position des Wavelets entlang der Zeitachse zu variieren, was die Flexibilität und Anpassungsfähigkeit der Transformation erhöht. Durch die Anpassung des Translationsparameters könnte die CWT so konfiguriert werden, dass sie Ausgabematrizen mit ähnlichen Dimensionen wie die des STFT erzeugt. Dies würde es ermöglichen, eine direktere und fairere Vergleichbarkeit zwischen den beiden Transformationen hinsichtlich ihrer Leistung und Effizienz zu gewährleisten.
0