Conceitos essenciais
텍스트 가이드 확산 모델을 이용하여 두드러진 객체의 경계를 유지하면서 자연스러운 배경을 생성하는 방법을 제안한다.
Resumo
이 논문은 두드러진 객체의 경계를 유지하면서 자연스러운 배경을 생성하는 방법을 제안한다. 기존의 확산 모델 기반 채우기 모델은 객체의 경계를 확장하는 문제가 있었는데, 이를 해결하기 위해 ControlNet 아키텍처를 활용한다. ControlNet은 두드러진 객체의 마스크를 추가 입력으로 사용하여 객체 경계를 유지하도록 한다. 다양한 데이터셋에 대한 실험 결과, 제안 모델이 기존 모델 대비 객체 확장을 3.6배 줄이면서도 시각적 지표에서 우수한 성능을 보였다. 또한 배경 생성 시 텍스트 프롬프트의 영향, 객체 카테고리별 확장 정도 등을 분석하였다.
Estatísticas
제안 모델은 기존 모델 대비 객체 확장을 3.6배 줄였다.
제안 모델은 FID, LPIPS 등 시각적 지표에서도 우수한 성능을 보였다.
텍스트 프롬프트가 자연스럽지 않은 경우 배경의 다양성이 감소하지만 객체 확장은 크게 개선되었다.
실내 환경의 세부 객체에서 가장 큰 객체 확장이 관찰되었다.
Citações
"텍스트 가이드 확산 모델을 이용하여 두드러진 객체의 경계를 유지하면서 자연스러운 배경을 생성하는 방법을 제안한다."
"제안 모델은 기존 모델 대비 객체 확장을 3.6배 줄였다."
"텍스트 프롬프트가 자연스럽지 않은 경우 배경의 다양성이 감소하지만 객체 확장은 크게 개선되었다."