Khái niệm cốt lõi
Desigen은 배경 이미지와 조화로운 레이아웃 요소를 자동으로 생성하는 파이프라인을 제안한다. 배경 생성 시 사용자 지정 공간 보존을 위한 주의 집중 제어 기술을 도입하고, 배경과 레이아웃의 조화로운 구성을 위한 반복적 최적화 전략을 제시한다.
Tóm tắt
이 논문은 디자인 템플릿 자동 생성을 위한 Desigen 파이프라인을 제안한다. Desigen은 배경 이미지 생성과 레이아웃 생성의 두 가지 주요 구성 요소로 이루어져 있다.
배경 생성 부분:
- 현재 최첨단 확산 기반 모델은 배경 이미지 생성 시 레이아웃 요소를 위한 충분한 비주요 공간을 보존하는 데 한계가 있음
- 이를 해결하기 위해 주의 집중 제어 기술을 제안:
- 주의 집중 맵과 배경 이미지 주요도 맵의 상관관계를 활용하여 주의 집중을 제한하는 손실 함수 도입
- 사용자 지정 마스크를 통해 원하는 영역의 주의 집중을 감소시키는 기법 제안
- 이를 통해 배경 이미지 생성 시 레이아웃을 위한 공간을 효과적으로 확보할 수 있음
레이아웃 생성 부분:
- 기존 레이아웃 생성 방법은 주어진 배경 이미지 기반으로만 레이아웃을 생성하여, 배경과 레이아웃의 조화로운 구성을 달성하기 어려움
- 이를 해결하기 위해 배경 생성기와 레이아웃 생성기 간의 반복적 최적화 전략을 제안:
- 생성된 레이아웃을 기반으로 배경 이미지를 재생성하여 배경과 레이아웃의 조화를 개선
- 조정된 배경 이미지를 활용하여 레이아웃을 다시 생성
실험 결과, 제안 방법은 기존 방법 대비 배경 이미지와 레이아웃의 조화도가 크게 향상되었음을 보여준다. 또한 프레젠테이션 생성 응용 사례를 통해 단일 페이지 디자인뿐만 아니라 일관된 주제의 슬라이드 세트 생성 능력도 입증하였다.
Thống kê
배경 이미지의 주요 영역 비율은 35.92%에서 20.65%로 감소하여 레이아웃을 위한 공간이 크게 확보되었다.
배경 이미지의 FID 점수는 39.36에서 31.52로 향상되어 미적 품질이 개선되었다.
배경 이미지와 텍스트 설명의 관련성을 나타내는 CLIP 점수는 31.21에서 29.20으로 유지되었다.
레이아웃의 정렬 점수는 0.23에서 0.35로, 중첩 점수는 15.91에서 14.41로 개선되었다.
배경 주요 영역과 레이아웃 간 중첩 비율은 28.26%에서 13.47%로 크게 감소하여 조화로운 구성이 달성되었다.
Trích dẫn
"현재 최첨단 확산 기반 모델은 배경 이미지 생성 시 레이아웃 요소를 위한 충분한 비주요 공간을 보존하는 데 한계가 있음"
"배경과 레이아웃의 조화로운 구성을 달성하기 위해 배경 생성기와 레이아웃 생성기 간의 반복적 최적화 전략을 제안"