Core Concepts
提案されたMOHOは、手持ちのオブジェクトを単一視点から再構築するための新しいフレームワークであり、多視点の遮蔽に注意した監督を活用しています。
Abstract
単一視点での手持ちオブジェクト再構築に焦点を当てる新しいフレームワークであるMOHOが提案されています。
MOHOは、手-オブジェクトビデオからの多視点遮蔽に注意した監督を利用しており、手誘発遮蔽とオブジェクト自体の遮蔽という2つの主要な課題に取り組んでいます。
結果として、2D監督されたMOHOは3D監督された方法よりも優れた結果を示すことが実験で示されています。
Introduction
Previous works focused on multi-view hand-held object reconstruction.
Single-view methods are gaining attention for real-world convenience.
Synthetic Pre-training Stage
Rendered a large-scale synthetic dataset SOMVideo for occlusion-free supervisions.
Auxiliary 2D amodal mask recovery head integrated into pre-training process.
Real-world Finetuning Stage
Leveraged amodal-mask-weighted geometric supervision to mitigate incomplete supervisions.
Introduced domain-consistent occlusion-aware features to overcome self-occlusion challenges.
Experimental Results
Extensive experiments on HO3D and DexYCB datasets demonstrated the superiority of 2D-supervised MOHO over 3D-supervised methods.
Stats
提案されたMOHOは、2D監督された方法よりも優れた結果を示すことが実験で示されています。