제안된 AOG-Net은 불완전한 360도 이미지를 점진적으로 외부로 확장하여 사용자가 제공한 텍스트 가이드와 일관된 고품질의 360도 이미지를 생성합니다.
확산 모델의 이미지 생성 성능을 향상시키기 위해 픽셀 단위 강화 학습 기법을 제안한다. 이를 통해 모델이 사용자 선호도에 맞춰 이미지를 생성할 수 있도록 한다.
확산 모델을 이용하여 다양한 관점에서 보이는 광학 착시 이미지를 생성하는 방법을 제안합니다.
이 논문은 팔 길이로 촬영한 사진에서 전신 셀피를 생성하는 방법을 제안합니다. 얼굴과 몸 부위의 4개 셀피와 배경 이미지를 입력으로 받아, 원하는 포즈의 전신 셀피를 생성합니다.
GenHowTo 모델은 입력 이미지와 텍스트 프롬프트를 활용하여 행동과 최종 상태를 생성할 수 있다.
CLoRA는 주의 집중 맵을 활용하여 다양한 LoRA 모델을 효과적으로 통합하고, 대조 학습을 통해 생성된 이미지의 충실도를 높입니다. 이를 통해 사용자가 정의한 여러 개념과 스타일을 하나의 이미지에 정확하게 반영할 수 있습니다.
개인의 사진과 개념적 스케치만으로 개인화된 캐리커처를 자동으로 생성할 수 있는 방법을 제안한다.
확산 모델의 복잡한 구조와 높은 계산 요구로 인한 지연 문제를 해결하기 위해 모델 축소와 샘플링 단계 감소를 통해 실시간 이미지 생성을 달성하였다.
확산 모델을 이용하여 두 이미지 간의 부드럽고 직접적이며 사실적인 보간 이미지를 생성하는 방법을 제안한다.
DreamSampler는 역 확산 샘플링과 점수 증류 접근법을 통합하여 모델 아키텍처 조정이나 특징 공학 없이도 이미지 편집, 복원 등 다양한 응용 분야에서 경쟁력 있는 성능을 달성합니다.