Concepts de base
Dieser Benchmark bietet eine umfangreiche Sammlung von Datensätzen mit annotierten Verhaltensweisen verschiedener Tierarten, um die Entwicklung und den Vergleich von Methoden zur automatischen Verhaltensklassifizierung aus Sensordaten zu unterstützen.
Résumé
Der Bio-logger Ethogram Benchmark (BEBE) ist eine Sammlung von neun Datensätzen mit Verhaltensannotationen, die eine große taxonomische Vielfalt abdecken. Die Datensätze enthalten Bewegungsdaten wie Beschleunigung, Winkelgeschwindigkeit und Umgebungsvariablen wie Tiefe oder Leitfähigkeit, die von Tiersensoren aufgezeichnet wurden.
Jeder Datensatz enthält Aufzeichnungen von mehreren Individuen einer Tierart und umfasst zwischen 6 und über 1000 Stunden annotierter Daten. Die Verhaltensannotationen wurden von Forschern manuell erstellt, basierend auf direkten Beobachtungen oder Videoaufnahmen.
BEBE bietet eine standardisierte Aufgabe zur Verhaltensklassifizierung, bei der Modelle trainiert werden, um die annotierten Verhaltensweisen aus den Sensordaten vorherzusagen. Verschiedene Evaluationsmetriken wie Präzision, Recall und F1-Wert werden verwendet, um die Leistung der Modelle zu bewerten.
In dieser Studie wurden sechs Modelle, darunter klassische Maschinelle-Lernverfahren und tiefe neuronale Netze, auf den BEBE-Datensätzen getestet. Die Ergebnisse zeigen, dass tiefe neuronale Netze, insbesondere ein konvolutionell-rekurrentes Netzwerk, die besten Ergebnisse erzielten. Außerdem konnte ein selbstüberwacht vortrainiertes neuronales Netz die Leistung weiter verbessern, vor allem wenn nur wenige annotierte Trainingsdaten zur Verfügung standen.
Darüber hinaus wurde untersucht, wie sich die Modellleistung für verschiedene Verhaltensweisen unterscheidet und wie sich eine Erhöhung der Trainingsdatenmenge auswirkt. Einige Verhaltensweisen konnten auch mit mehr Trainingsdaten nur geringfügig besser erkannt werden, was auf Grenzen der Sensordaten für die Unterscheidung dieser Verhaltensweisen hindeutet.
Der BEBE-Benchmark und die zugehörigen Modelle sind öffentlich zugänglich, um die Entwicklung und den Vergleich von Methoden zur Verhaltensklassifizierung aus Tiersensordaten zu unterstützen.
Stats
Die Datensätze in BEBE umfassen insgesamt 1654 Stunden annotierter Daten von 149 Individuen aus neun Tierarten.
Citations
"Tierverhaltensanalyse ist von zentraler Bedeutung in Ökologie und Evolution, da das Verhalten eines Individuums seine Fortpflanzungschancen und Überlebenswahrscheinlichkeit beeinflusst."
"Maschinelles Lernen kann dazu beitragen, den manuellen Aufwand zur Zuordnung von Verhaltensbezeichnungen zu Sensordaten zu minimieren oder auf Daten auszuweiten, bei denen eine manuelle Überprüfung nicht möglich ist."