Core Concepts
商用車のトリップログデータを活用し、都市交差点の交通渋滞を予測するモデルを開発する。
Abstract
本研究は、主要米国都市の4,800以上の交差点における商用車のトリップログデータを活用し、交通渋滞を予測するモデルの開発を目的としている。
データ探索では、交差点の座標、道路名、時間帯、交通指標などの27の特徴量を分析した。さらに、降雨/降雪率、ダウンタウンからの距離、道路タイプなどの追加特徴量を組み込んだ。
欠損値の処理には低ランク行列モデルとラベルエンコーディングを活用した。
予測モデルとしては、重回帰分析、k-nearest neighbors、勾配ブースティングの3手法を検討した。それぞれ長所短所があり、用途に応じて使い分けることが重要である。
重回帰分析は単純で解釈しやすいが、非線形関係の捕捉が難しい。k-nearest neighborsは性能が良いが計算量が多い。勾配ブースティングは複雑な関係を捉えられるが、気象データの追加は性能向上に寄与しなかった。
本研究の成果は、都市計画者や政府が交通渋滞のホットスポットを予測し、インフラ整備や運用最適化に活用できる。また、自動運転の高度化にも貢献できる。
ただし、データセキュリティと部分遮蔽物体検出の課題にも留意が必要である。
Stats
交差点ごとの平均待ち時間は約7.69分
最大待ち時間は約309.97分
気象データを含めた場合の平均絶対誤差は9.50分
気象データを除いた場合の平均絶対誤差は9.49分
Quotes
"交通渋滞は都市部の重要な課題であり、通勤時間の増加、安全性の低下、運営の非効率性をもたらす。"
"交差点の交通渋滞を予測することで、都市計画者や政府が交通流の最適化、インフラ強化、交通システムの改善に役立つ。"
"機械学習と予測モデリングの手法は、都市交通課題に取り組む上で有効である。"