toplogo
Sign In

상호작용하는 두 사람의 고품질 다양한 동작 생성을 위한 확산 기반 접근법


Core Concepts
본 논문은 일반 사용자가 텍스트 지침만으로 고품질의 두 사람 상호작용 동작을 생성할 수 있는 효과적인 확산 기반 접근법을 제안한다.
Abstract
본 논문은 두 사람 상호작용 동작 생성을 위한 효과적인 확산 기반 접근법을 제안한다. 첫째, 저자들은 다양한 두 사람 상호작용 동작과 자연어 설명을 포함하는 대규모 InterHuman 데이터셋을 구축했다. 둘째, 저자들은 두 사람의 동작 생성 과정에서 대칭성을 효과적으로 처리하기 위해 가중치를 공유하는 두 개의 협력적인 변환기 기반 노이즈 제거기를 도입했다. 셋째, 저자들은 두 사람 간의 공간적 관계를 명시적으로 인코딩하는 새로운 동작 표현을 제안했다. 넷째, 저자들은 두 사람 간의 공간적 관계를 모델링하기 위한 두 가지 새로운 정규화 손실 함수를 도입했다. 이러한 기술적 기여를 통해 제안된 InterGen 모델은 이전 방법보다 더 다양하고 설득력 있는 두 사람 상호작용 동작을 생성할 수 있다.
Stats
"두 사람이 서로 주먹을 치며 싸우고 있다." "두 사람이 서로 팔을 잡고 있다." "두 사람이 서로 껴안고 있다."
Quotes
"두 사람이 열정적으로 라틴 댄스를 추고 있다." "한 사람이 계속해서 주먹을 휘두르고 다른 사람은 방어하며 반격하고 있다."

Key Insights Distilled From

by Han Liang,We... at arxiv.org 03-29-2024

https://arxiv.org/pdf/2304.05684.pdf
InterGen

Deeper Inquiries

두 사람 상호작용 동작 생성에 있어 다른 모달리티(예: 음악, 이미지)를 활용하는 방법은 무엇일까?

다른 모달리티를 활용하여 두 사람 상호작용 동작을 생성하는 방법은 다양한 입력 소스를 통합하여 보다 풍부하고 다양한 결과물을 얻는 것을 의미합니다. 예를 들어, 음악을 활용할 경우, 음악의 리듬이나 감정을 분석하여 해당 음악에 맞는 동작을 생성할 수 있습니다. 이미지를 활용할 경우, 시각적 정보를 기반으로 두 사람의 동작을 생성하거나 이미지와 텍스트를 함께 활용하여 더 풍부한 상호작용 동작을 만들어낼 수 있습니다. 이러한 다양한 모달리티를 융합하여 상호작용 동작 생성 모델을 보다 다양하고 창의적으로 발전시킬 수 있습니다.

두 사람 상호작용 동작 생성에 있어 물리적 제약 조건을 더 잘 모델링하는 방법은 무엇일까?

물리적 제약 조건을 더 잘 모델링하기 위해서는 동작 생성 모델에 물리적 제약 조건을 명확하게 통합해야 합니다. 예를 들어, 인체의 구조적 제약을 고려하여 관절 각도, 균형, 운동 범위 등을 모델에 반영할 수 있습니다. 또한 두 사람 간의 상호작용에서 발생하는 물리적 상호작용(예: 충돌, 밀림 등)을 모델에 포함시켜 실제적이고 현실적인 동작을 생성할 수 있습니다. 물리적 제약을 모델에 통합함으로써 생성된 동작이 더 자연스럽고 현실적이며 물리적으로 타당한 결과물을 얻을 수 있습니다.

두 사람 상호작용 동작 생성과 관련하여 윤리적 고려사항은 무엇일까?

두 사람 상호작용 동작 생성에는 다양한 윤리적 고려사항이 존재합니다. 먼저, 생성된 동작이 혐오스러운, 차별적이거나 폭력적인 내용을 포함하면 안 되며, 이러한 측면을 방지하기 위해 데이터 수집 및 모델 학습 시에 다양성과 포용성을 고려해야 합니다. 또한, 개인정보 보호와 데이터 활용에 대한 동의를 적절히 관리하여 사용자의 권리를 보호해야 합니다. 또한, 생성된 동작이 현실과 구별이 어려운 deepfake와 같은 기술적 문제에 대한 대응책을 마련하여 사회적 영향을 고려해야 합니다. 이러한 윤리적 고려사항을 준수함으로써 두 사람 상호작용 동작 생성 기술을 적절하게 활용하고 발전시킬 수 있습니다.
0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star