본 논문은 확산 확률 모델 기반의 이미지 생성 방법인 관찰 기반 확산 확률 모델(OGDM)을 제안한다. OGDM은 이미지 생성 성능과 빠른 샘플링 속도 사이의 트레이드오프를 효과적으로 해결한다.
OGDM의 핵심 아이디어는 관찰 과정의 지침을 마르코프 체인에 체계적으로 통합하여 훈련 목적을 재정립하는 것이다. 이를 위해 OGDM은 노이즈 수준을 나타내는 조건부 판별기를 사용하여 추가적인 손실 항을 도입한다. 이 전략을 통해 OGDM은 제한된 함수 평가 횟수에서도 더 정확한 음의 로그-우도를 최적화할 수 있다.
OGDM의 훈련 방식은 파인튜닝 과정에 통합되어 다양한 빠른 추론 전략과 호환된다. 따라서 OGDM은 추가적인 계산 비용 없이 더 나은 디노이징 네트워크를 생성할 수 있다. 실험 결과, OGDM은 강력한 확산 모델 베이스라인에 다양한 추론 기법을 적용할 때 효과적인 성능 향상을 보여준다.
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések