Core Concepts
本研究では、知識グラフ(KG)の推論能力とラージランゲージモデル(LLM)の表現力を組み合わせたRAG手法を用いて、道路利用者の行動を説明可能に予測するシステムを提案している。
Abstract
本研究は、自動運転の文脈において道路利用者の行動を予測する取り組みについて述べている。従来の研究では、運動学情報のみに基づいて行動を予測していたが、道路利用者は人間であり、周囲の状況に大きく影響されるため、文脈的な情報を考慮する必要がある。
本研究では、知識グラフ(KG)とラージランゲージモデル(LLM)を組み合わせたRAG手法を用いて、道路利用者の行動を説明可能に予測するシステムを提案している。具体的には以下の2つのユースケースを実装している:
歩行者の横断行動の予測
車線変更行動の予測
両ケースともに、従来手法を上回る予測精度と先行性を示しており、この分野の今後の研究に有望な道筋を示している。
Stats
歩行者の横断行動予測では、PSIデータセットの60ルール、JAAAデータセットの51ルールを抽出した。
車線変更行動予測では、HighDデータセットから351,736個の訓練用トリプル、2,000個の検証用トリプル、12,222個の テスト用トリプルを生成した。
Quotes
"道路利用者の行動は、人間的要因、性別や年齢、注意レベルやまなざしの方向など、多くの要因に依存する。"
"従来の深層学習手法は、文脈的な意味情報を十分に理解し活用することができず、また説明可能性に欠けるという課題がある。"
"ニューロシンボリック学習は、事前知識を活用して、複雑な文脈の中で正確かつ一般化可能な推論を行うことができる。"