本研究では、一人称ビデオから、将来のアクション開始時に接触するオブジェクトの位置を予測する新しいタスク「次のアクティブオブジェクトの予測(ANACTO)」を提案している。
提案手法のT-ANACTOは以下の特徴を持つ:
実験の結果、提案手法T-ANACTOは、EpicKitchens-100、EGTEA+、Ego4Dデータセットにおいて、関連する既存手法と比較して優れた性能を示した。また、定性的な分析から、T-ANACTOが過去の観察から人間-オブジェクト相互作用の可能性の高い領域に注目していることが分かった。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Sanket Thaku... ב- arxiv.org 05-02-2024
https://arxiv.org/pdf/2302.06358.pdfשאלות מעמיקות