Die Studie befasst sich mit der Modellierung der Unfallschwere unter Verwendung von Crash-Daten, die oft stark unausgewogen sind, da die meisten Unfälle keine tödlichen Folgen haben und nur eine kleine Anzahl tödliche Unfälle aufweist. Solche Unausgewogenheiten stellen eine Herausforderung für die Modellierung der Unfallschwere dar, da es schwierig ist, die Ergebnisse tödlicher Unfälle mit sehr begrenzten Stichproben zu erfassen und zu interpretieren.
Die Studie entwickelt eine Methode zur Generierung von Crash-Daten basierend auf CTGAN, die in der Lage ist, kontinuierliche und diskrete Risikofaktoren gleichzeitig zu berücksichtigen. Um die Sparsamkeit diskreter Risikofaktoren effektiv anzugehen, verwendet die vorgeschlagene Datengenerierungsmethode einen bedingten Generator, um die Verteilung der realen Daten für die Stichprobengenerierung zu schätzen.
Experimente mit realen Daten und Monte-Carlo-Simulationen werden durchgeführt, um die interpretative Konsistenz der synthetischen Stichproben in Bezug auf Verteilungskonsistenz und Parameterrekonstruktion zu bewerten. Diese Experimente decken drei Arten von Szenarien ab: Zwei-Klassen-Unausgewogenheit, Drei-Klassen-Unausgewogenheit und verschiedene Resampling-Verhältnisse.
Eine umfassende Studie wird durchgeführt, um die Leistung verschiedener Resampling-Methoden (Über-, Unter- und gemischtes Sampling) bei der Modellierung der Unfallschwere mit der vorgeschlagenen Datengenerierungsmethode zu vergleichen. Die Ergebnisse zeigen, dass die vorgeschlagene Datengenerierungsmethode alle anderen Basismodelle übertrifft.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Junlan Chen,... at arxiv.org 04-04-2024
https://arxiv.org/pdf/2404.02187.pdfDeeper Inquiries