Core Concepts
본 논문은 일반 사용자가 텍스트 지침만으로 고품질의 두 사람 상호작용 동작을 생성할 수 있는 효과적인 확산 기반 접근법을 제안한다.
Abstract
본 논문은 두 사람 상호작용 동작 생성을 위한 효과적인 확산 기반 접근법을 제안한다.
첫째, 저자들은 다양한 두 사람 상호작용 동작과 자연어 설명을 포함하는 대규모 InterHuman 데이터셋을 구축했다.
둘째, 저자들은 두 사람의 동작 생성 과정에서 대칭성을 효과적으로 처리하기 위해 가중치를 공유하는 두 개의 협력적인 변환기 기반 노이즈 제거기를 도입했다.
셋째, 저자들은 두 사람 간의 공간적 관계를 명시적으로 인코딩하는 새로운 동작 표현을 제안했다.
넷째, 저자들은 두 사람 간의 공간적 관계를 모델링하기 위한 두 가지 새로운 정규화 손실 함수를 도입했다.
이러한 기술적 기여를 통해 제안된 InterGen 모델은 이전 방법보다 더 다양하고 설득력 있는 두 사람 상호작용 동작을 생성할 수 있다.
Stats
"두 사람이 서로 주먹을 치며 싸우고 있다."
"두 사람이 서로 팔을 잡고 있다."
"두 사람이 서로 껴안고 있다."
Quotes
"두 사람이 열정적으로 라틴 댄스를 추고 있다."
"한 사람이 계속해서 주먹을 휘두르고 다른 사람은 방어하며 반격하고 있다."