本研究では、一人称ビデオから、将来のアクション開始時に接触するオブジェクトの位置を予測する新しいタスク「次のアクティブオブジェクトの予測(ANACTO)」を提案している。
提案手法のT-ANACTOは以下の特徴を持つ:
実験の結果、提案手法T-ANACTOは、EpicKitchens-100、EGTEA+、Ego4Dデータセットにおいて、関連する既存手法と比較して優れた性能を示した。また、定性的な分析から、T-ANACTOが過去の観察から人間-オブジェクト相互作用の可能性の高い領域に注目していることが分かった。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Sanket Thaku... às arxiv.org 05-02-2024
https://arxiv.org/pdf/2302.06358.pdfPerguntas Mais Profundas