核心概念
提案手法DiffH2Oは、テキストの指示に基づいて、現実的で制御可能な手-オブジェクト相互作用を生成する。
摘要
本研究では、手-オブジェクト相互作用の合成に関する新しい手法DiffH2Oを提案する。主な特徴は以下の通り:
- 手の動作とオブジェクトの動作を別々のステージで生成することで、限られたデータでも一般化性を高めている。
- 手とオブジェクトの位置関係を表す新しい表現を導入し、物理的な整合性を保っている。
- 事前の把持姿勢を利用したガイダンス手法を提案し、生成結果の制御性を高めている。
- 詳細なテキスト注釈を GRAB データセットに追加し、テキスト指示に基づく細かな制御を可能にしている。
定量的・定性的な評価から、提案手法が既存手法を大きく上回ることが示された。特に、物理的整合性、動作の多様性、アクション認識精度の向上が確認された。また、テキスト指示に基づく制御性の高さも実証された。
統計資料
手-オブジェクト相互作用の生成において、提案手法は既存手法と比べて以下の点で優れている:
物理的整合性が高く、手とオブジェクトの干渉が少ない (IV: 6.02 cm3)
生成された動作の多様性が高い (SD: 0.109 m)
動作のアクション認識精度が高い (手のみ: 83.3%, 手とオブジェクト: 87.5%)