핵심 개념
본 연구는 확산 모델을 활용하여 장면의 공간적 배치와 외관을 자유롭게 조작할 수 있는 방법을 제안한다. 레이어드 장면 표현을 최적화하여 객체의 위치, 크기, 복제 등 다양한 편집 작업을 지원한다.
초록
본 연구는 확산 모델을 활용하여 장면의 공간적 배치와 외관을 자유롭게 조작할 수 있는 방법을 제안한다.
- 레이어드 장면 표현을 도입하여 각 객체의 위치, 크기, 외관을 독립적으로 제어할 수 있다.
- 다수의 랜덤 레이아웃을 동시에 디노이징하여 공간적 디엔탱글먼트를 달성한다.
- 참조 이미지의 샘플링 궤적을 활용하여 기존 이미지의 내용을 유지하면서 공간적 편집을 수행할 수 있다.
- 객체 스타일링, 교체 등 레이어 단위의 외관 편집도 가능하다.
- 정량적 평가에서 기존 방법들을 크게 앞서는 성능을 보였다.
통계
"a photo of a giant macaron and a croissant splashing in the Seine with the Eiffel Tower in the background"
"bed, wooden cabinet, window, bedroom"