Core Concepts
本研究は、不均衡なデータを扱うための生成的深層学習アプローチを提案し、重度事故深刻度モデリングの性能を向上させる。
Abstract
本研究は、重度事故深刻度モデリングの課題に取り組むため、生成的深層学習アプローチを提案している。
主な内容は以下の通り:
重度事故データの不均衡問題に対処するため、条件付きテーブルGAN (CTGAN)に基づくデータ生成手法を開発した。CTGANは、連続変数と離散変数の両方を効果的に処理できる。
実データと Monte Carlo シミュレーションを用いて、生成データの解釈一貫性を評価した。2クラス不均衡、3クラス不均衡、および様々なリサンプリング比率の3つのシナリオを検討した。
オーバーサンプリング、アンダーサンプリング、ミックスサンプリングの3つのリサンプリング手法のベースラインモデルと提案手法を比較した。結果、提案手法であるCTGAN-RUが最も優れたパフォーマンスを示した。
全体として、本研究は、不均衡な重度事故データを扱う際の有効な手法を提示し、交通安全研究者や技術者にとって有益な洞察を提供している。
Stats
重度事故の発生確率は非重度事故に比べて極めて低い。
重度事故は全事故の0.05%しか占めていない。