本研究では、密集で無秩序な交通環境における自動運転システムの理解を深めるため、「IDD-X」と呼ばれる大規模な双方向ドライビングビデオデータセットを提案している。このデータセットには、697Kの境界ボックス、9Kの重要物体トラック、1-12個の物体/ビデオといった包括的な自我中心的な注釈が含まれている。10種類の物体カテゴリと19種類の説明ラベルカテゴリが定義されている。
また、リアビューの情報も含まれており、ドライビング環境をより完全に表現している。さらに、複数の重要物体の位置特定と物体ごとの説明予測を目的とした独自設計のディープネットワークも提案されている。
全体として、本データセットとモデルは、複雑な交通状況における道路条件と周辺物体がドライビング行動に及ぼす影響を研究する基盤を形成している。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Chirag Parik... at arxiv.org 04-15-2024
https://arxiv.org/pdf/2404.08561.pdfDeeper Inquiries