Temel Kavramlar
Predicting 3D action targets from egocentric vision enhances human-robot interaction safety and efficiency.
Özet
ロボットの能力を向上させ、人間とのロボット間相互作用(HRI)において安全性と効率性を向上させるために、手の動きの3Dアクションターゲット位置を予測することが重要です。本研究では、EgoPAT3Dデータセットを拡張し、新しいアルゴリズムを導入して、RGB画像だけで優れた予測結果を達成しました。これにより、実世界でのロボットプラットフォームへの展開が可能となります。
İstatistikler
EgoPAT3Dデータセットは4129から9579まで増加。
データセットには9人の追加被験者と12の新しいシーンが含まれる。
アルゴリズムはConvNeXt Tinyを使用しており、17FPSで安定したパフォーマンスを達成。
Alıntılar
"Predicting the action target’s 3D coordinate could pave the way for more versatile downstream robotics tasks."
"Our novel algorithm can now achieve superior prediction outcomes using solely RGB images."
"The demonstrations showcase the real-world applicability of our advancements."