Основні поняття
本研究は、物体の姿勢アノテーションを必要とせずに、カテゴリレベルの物体姿勢推定器を学習する新しい手法を提案する。拡散モデルを利用して生成された複数の物体ビューから、物体姿勢の特徴を学習することで、効率的に姿勢推定器を構築できる。
Анотація
本研究は、物体の姿勢アノテーションを必要とせずに、カテゴリレベルの物体姿勢推定器を学習する新しい手法を提案している。
まず、拡散モデルを利用して、単一の物体画像から、様々な角度の物体ビューを生成する。次に、生成された画像から特徴マップを抽出し、それぞれの物体に対して独立したニューラルメッシュを学習する。最後に、これらのニューラルメッシュを統合することで、カテゴリレベルの物体姿勢推定器を構築する。
実験結果から、提案手法は、わずか1つの姿勢アノテーションを使用しただけでも、既存手法を大きく上回る性能を示すことが分かった。さらに、姿勢アノテーションを一切使用しない場合でも、良好な姿勢推定結果が得られることが確認された。これは、拡散モデルから生成された多様な物体ビューを効果的に活用できたことによるものと考えられる。
Статистика
物体姿勢推定の中央誤差は15.4度まで改善された。
姿勢推定の正解率(Acc30)は77.4%まで向上した。
Цитати
"本研究は、物体の姿勢アノテーションを必要とせずに、カテゴリレベルの物体姿勢推定器を学習する新しい手法を提案する。"
"拡散モデルを利用して生成された複数の物体ビューから、物体姿勢の特徴を学習することで、効率的に姿勢推定器を構築できる。"