이 논문은 확산 모델을 활용하여 역문제를 해결하는 새로운 접근법인 SSD(Shortcut Sampling for Diffusion)를 제안한다. 기존 방법들은 주로 후향 샘플링 과정을 수정하는 데 초점을 맞추었지만, 이 논문에서는 전방 과정을 개선하여 입력 이미지와 복원 이미지 사이의 중간 상태를 찾는 것에 주목한다.
SSD의 핵심 개념은 입력 이미지 y와 복원 이미지 x를 연결하는 특정 중간 상태 E를 찾는 것이다. 이를 위해 제안하는 Distortion Adaptive Inversion(DA Inversion) 기법은 제어 가능한 무작위 교란을 도입하여 E가 입력 이미지의 정보를 보존하면서도 정규 분포에 가깝도록 유도한다.
이후 생성 과정에서는 디노이징 단계와 역투영 단계를 반복적으로 수행하여 입력 이미지와 일관성을 유지하면서도 세부 텍스처를 생성한다. 또한 SSD+를 통해 노이즈가 있거나 열화 연산자 H의 추정이 부정확한 경우에도 강건한 성능을 발휘할 수 있도록 확장하였다.
실험 결과, SSD는 기존 최신 방법들과 비교하여 적은 수의 신경망 함수 평가(NFE)로도 경쟁력 있는 성능을 달성할 수 있음을 보였다. 또한 100 NFE로 실행할 경우 특정 역문제 과제에서 기존 최신 방법을 능가하는 성능을 보였다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問