Keskeiset käsitteet
본 연구는 고도로 사실적인 예술적 스타일 이미지를 생성하고 입력 콘텐츠 이미지의 콘텐츠 구조를 잘 보존할 수 있는 새로운 사전 훈련 확산 모델 기반 방법을 제안한다.
Tiivistelmä
본 연구는 예술적 스타일 전이를 위한 새로운 사전 훈련 확산 모델 기반 프레임워크를 제안한다. 이 프레임워크는 고도로 사실적인 스타일화된 이미지를 생성하고 입력 콘텐츠 이미지의 콘텐츠 구조를 잘 보존할 수 있다. 구체적으로 다음과 같은 핵심 내용을 포함한다:
- 단계 인식 및 레이어 인식 프롬프트 공간을 도입하여 확산 과정의 단계와 레이어 차원에서 입력 이미지의 콘텐츠 구조와 스타일 패턴을 동적으로 조정할 수 있다.
- 단계 인식 및 레이어 인식 프롬프트 역전 방법을 제안하여 프롬프트 공간이 작품 컬렉션의 스타일 정보를 학습할 수 있도록 한다.
- 사전 훈련된 ControlNet의 조건부 분기를 주입하여 콘텐츠 구조를 더 잘 유지할 수 있도록 한다.
- 광범위한 실험을 통해 제안 방법이 기존 최첨단 GAN 기반 및 확산 모델 기반 방법보다 우수한 성능을 보임을 입증한다.
Tilastot
제안 방법은 Van Gogh 스타일의 FID 점수가 94.17로 가장 낮다.
제안 방법은 Morisot 스타일의 FID 점수가 176.70으로 가장 낮다.
제안 방법은 Ukiyoe 스타일의 FID 점수가 92.03으로 가장 낮다.
Lainaukset
"본 연구는 고도로 사실적인 예술적 스타일 이미지를 생성하고 입력 콘텐츠 이미지의 콘텐츠 구조를 잘 보존할 수 있는 새로운 사전 훈련 확산 모델 기반 방법을 제안한다."
"단계 인식 및 레이어 인식 프롬프트 공간을 도입하여 확산 과정의 단계와 레이어 차원에서 입력 이미지의 콘텐츠 구조와 스타일 패턴을 동적으로 조정할 수 있다."
"단계 인식 및 레이어 인식 프롬프트 역전 방법을 제안하여 프롬프트 공간이 작품 컬렉션의 스타일 정보를 학습할 수 있도록 한다."