本研究では、一人称ビデオから、将来のアクション開始時に接触するオブジェクトの位置を予測する新しいタスク「次のアクティブオブジェクトの予測(ANACTO)」を提案している。
提案手法のT-ANACTOは以下の特徴を持つ:
実験の結果、提案手法T-ANACTOは、EpicKitchens-100、EGTEA+、Ego4Dデータセットにおいて、関連する既存手法と比較して優れた性能を示した。また、定性的な分析から、T-ANACTOが過去の観察から人間-オブジェクト相互作用の可能性の高い領域に注目していることが分かった。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Sanket Thaku... kl. arxiv.org 05-02-2024
https://arxiv.org/pdf/2302.06358.pdfDybere Forespørgsler