Core Concepts
拡散モデルを用いて、深度画像とポイントクラウドの入力から、反復的に手関節位置を正確に推定する。
Abstract
本論文は、拡散モデルを用いた新しい3D手姿勢推定手法であるHandDiffを提案している。HandDiffは、深度画像とポイントクラウドを入力として、反復的な除雑音プロセスを通じて、正確な3D手関節位置を推定する。
具体的には以下の特徴を持つ:
関節ごとの条件生成モジュールと、局所特徴に基づく除雑音モジュールを導入し、各関節の位置推定精度を向上させる
関節間の運動学的関係を捉えるグラフ畳み込み演算を組み込む
4つのベンチマークデータセットで最新の精度を達成
HandDiffは、深度画像とポイントクラウドの両方の情報を活用し、関節ごとの局所特徴と運動学的関係を考慮することで、従来手法を大きく上回る精度を実現している。
Stats
深度画像と3Dポイントクラウドを入力として使用
手関節の3D座標を出力