본 연구는 3D 가우시안 스플래팅을 활용하여 기존 최적화 기반 2D 리프팅 방식보다 효율적이면서도 경쟁력 있는 3D 콘텐츠 생성 방법을 제안한다.
최근 몇 년간 3D 콘텐츠 생성 기술이 급격히 발전하였으며, 다양한 입력 모달리티(텍스트, 이미지, 비디오, 오디오 등)를 활용한 3D 콘텐츠 생성 기술이 등장하였다.
사용자가 대화를 통해 반복적으로 자신의 창의적 아이디어를 전달할 수 있도록 하고, 생성된 캐릭터가 사용자의 기대에 부합하도록 하는 상호작용적 캐릭터 편집 프레임워크를 제안합니다.
사용자가 대화를 통해 반복적으로 자신의 창의적 아이디어를 전달할 수 있도록 하고, 생성된 캐릭터가 사용자의 기대에 부합하도록 하는 상호작용적 캐릭터 편집 프레임워크를 제안한다.
단일 이미지에서 다중 객체로 구성된 고품질 3D 자산을 생성하는 ComboVerse 프레임워크를 제안합니다. 이를 위해 개별 객체 재구성과 객체 조합 최적화를 수행하며, 공간 인식 확산 가이드를 통해 객체 배치를 개선합니다.
대규모 비디오 생성 모델을 활용하여 다중 뷰 이미지를 효율적이고 일관성 있게 생성하는 방법을 제안한다.
본 연구는 사용자 친화적인 인터페이스와 통합 깊이 인식 인페인팅 모델을 통해 텍스트 기반 텍스처 합성의 유연성, 효율성 및 일관성을 향상시킨다.
폐루프 전사 기반 새로운 시점 합성 모델 Ctrl123은 생성된 새로운 시점과 실제 시점 간의 정렬을 향상시켜 기존 방법들의 일관성 문제를 해결한다.
Make-Your-3D는 단 하나의 주제 이미지만으로도 5분 내에 텍스트 기반 수정을 통해 고품질의 일관된 3D 콘텐츠를 생성할 수 있다.