核心概念
InterHandGenは、対話型二手インタラクションを高品質かつ多様に生成するための新しい枠組みを提案する。二手の関節分布をモデル化する際の複雑さを低減するため、単一手の無条件分布と条件付き分布を個別にモデル化する手法を導入する。
要約
本論文は、対話型二手インタラクションを生成するための新しい枠組み「InterHandGen」を提案している。二手の関節分布をモデル化する際の複雑さを低減するため、単一手の無条件分布と条件付き分布を個別にモデル化する手法を導入している。
具体的には以下の通り:
二手の関節分布を、左手の無条件分布と右手の左手条件付き分布の積で表現する。
拡散モデルを用いて、単一手の無条件分布と条件付き分布を共有ネットワークで学習する。
逆拡散時には、左手を無条件でサンプリングし、次に右手を左手の条件下でサンプリングする。
生成の際には、クラシファイアフリーガイダンスと反貫入ガイダンスを導入し、高品質かつ物理的に妥当な二手インタラクションを生成する。
提案手法は、二手インタラクション推定などの下流タスクでも有効に活用できる。
統計
二手インタラクションの生成では、平均貫入体積が0.76 cm3と小さい。
二手が近接する割合は0.97と高い。
引用
"直接二手の関節分布をモデル化すると、その組み合わせの複雑さから学習が困難になる。"
"二手の関節分布を、単一手の無条件分布と条件付き分布の積で表現することで、学習の複雑さを効果的に低減できる。"