MM-AUは、11,727件の野生のエゴビュー事故動画を含む新しいデータセットであり、58種類の事故カテゴリーをカバーしています。AdVersa-SDは、OAVDによって駆動されるObject-centric Accident Video Diffusionモデルを提案し、特定の事故における主要な因果関係連鎖を明示的に探索します。実験結果では、Abductive CLIPがAdVersa-SDで優れた性能を発揮し、OAVDが他の最先端拡散モデルに対して優越性を示すことが確認されています。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések