핵심 개념
동기화된 확산 프로세스를 통해 다양한 시각 콘텐츠(모호한 이미지, 파노라마 이미지, 메시 텍스처, 가우시안 스플랫 텍스처)를 생성할 수 있는 일반적인 프레임워크를 제안한다. 특히 인스턴스 공간에서의 디노이징 과정을 동기화하여 Tweedie's 공식의 출력을 평균하는 SyncTweedies 방식이 가장 우수한 성능과 광범위한 적용성을 보인다.
초록
이 논문은 동기화된 확산 프로세스를 활용하여 다양한 시각 콘텐츠를 생성하는 일반적인 프레임워크를 제안한다.
- 이미지 확산 모델의 일반화: 기존 이미지 확산 모델의 능력을 확장하여 파노라마 이미지, 3D 메시 텍스처, 가우시안 스플랫 텍스처 등 다양한 시각 콘텐츠를 생성할 수 있도록 한다.
- 동기화된 확산 프로세스: 캐노니컬 공간(canonical space)과 인스턴스 공간(instance space) 간 매핑 함수를 활용하여 다양한 동기화 시나리오를 탐색한다. 특히 인스턴스 공간에서의 디노이징 과정을 동기화하여 Tweedie's 공식의 출력을 평균하는 SyncTweedies 방식이 가장 우수한 성능과 광범위한 적용성을 보인다.
- 다양한 응용 분야: 모호한 이미지 생성, 파노라마 생성, 3D 메시 텍스처링, 가우시안 스플랫 텍스처링 등 다양한 응용 분야에서 SyncTweedies의 우수한 성능을 입증한다.
통계
이미지 확산 모델은 방대한 규모의 인터넷 데이터셋을 활용하여 학습된다.
다양한 시각 콘텐츠를 생성하기 위해서는 해당 데이터셋을 수집하는 것이 어렵다.
따라서 이미지와 다른 시각 콘텐츠 간 매핑 함수를 활용하여 기존 이미지 확산 모델을 활용한다.
인용구
"우리는 캐노니컬 공간 Z에서 데이터를 샘플링하는 일반적인 생성 프로세스를 고려한다. 여기서 사전 학습된 확산 모델은 제공되지 않지만, 대신 다른 공간인 인스턴스 공간 {Wi}i=1:N에서 학습된 확산 모델을 활용한다."
"우리는 다양한 동기화 시나리오를 탐색하여 캐노니컬 공간 Z에서의 생성 프로세스를 통합한다. 특히 인스턴스 공간에서의 디노이징 과정을 동기화하여 Tweedie's 공식의 출력을 평균하는 SyncTweedies 방식이 가장 우수한 성능과 광범위한 적용성을 보인다."