ポイントクラウドの3Dオブジェクト分類の精度を向上させるために、既に計算されている近傍点の距離と方向ベクトルを追加の近傍特徴として使用する。
本研究では、ハンド間の交差を最小化することで、単一画像からの相互作用する3Dハンド姿勢推定の精度を向上させる。
本研究は、3D空間における物体の細かな長期的な動きを同時に捉えることができる新しい課題である長期シーンフロー推定に取り組む。提案手法のSceneTrackerは、反復的なアプローチと変換器を用いて、3D空間の遮蔽や深度ノイズの影響に強く、長期的な3D軌跡の推定を実現する。
大規模な視覚言語モデルを活用して3Dポイントクラウドと物体カテゴリラベルの間の対応関係を間接的に構築し、物体とその関係の擬似ラベルを生成することで、3Dシーングラフを生成する。
本研究では、LiDARデータの疎らさと遮蔽の課題に取り組むための新しい汎用的な手法「X線ディスティレーション」を提案する。この手法は既存の3Dオブジェクト検出フレームワークに簡単に統合でき、教師あり学習と半教師あり学習の両方で優れた性能を発揮する。
DifFlow3Dは、拡散モデルを用いた反復的な洗練により、動的シーン、ノイズ入力、小さな物体、反復パターンなどの課題に対してより強いロバスト性を持つ3Dシーンフロー推定手法を提案する。また、推定信頼性を評価する不確実性推定モジュールを統合している。