核心概念
확산 확률 모델의 성능을 향상시키기 위해 가산 가우시안 잡음의 등방성을 제약으로 활용하는 접근법을 제안한다. 이를 통해 생성된 샘플의 충실도가 향상된다.
摘要
이 논문에서는 확산 확률 모델의 성능을 향상시키기 위해 가산 가우시안 잡음의 등방성을 제약으로 활용하는 접근법인 Iso-Diffusion을 제안한다.
기존 확산 확률 모델은 가산 가우시안 잡음과 예측된 잡음 사이의 평균 제곱 오차를 최소화하는 것이 목적이었다. 하지만 이 방식은 예측된 잡음이 등방성을 가지도록 강제하지 않는다.
Iso-Diffusion에서는 예측된 잡음의 등방성을 제약으로 추가하여 목적 함수를 수정하였다. 이를 통해 생성된 샘플의 충실도가 향상되었음을 4개의 2D 합성 데이터셋과 무조건부 이미지 생성 실험을 통해 확인하였다.
구체적으로:
- 2D 합성 데이터셋 실험에서 Precision과 Density 지표가 크게 향상되었다.
- 꽃 데이터셋과 애완동물 데이터셋에 대한 무조건부 이미지 생성 실험에서도 Precision, Density, FID 등의 지표가 개선되었다.
이러한 결과는 가산 잡음의 등방성을 제약으로 활용하는 것이 확산 모델의 성능 향상에 효과적임을 보여준다.
統計資料
가산 가우시안 잡음의 기댓값 제곱 노름은 차원 수와 같다.
데이터 분포의 등방성은 시간에 따라 증가하며 최종적으로 백색 가우시안 분포의 등방성에 수렴한다.
引述
"Denoising Diffusion Probabilistic Models (DDPMs)는 생성 AI 분야에서 많은 성과를 거두었다. 그러나 여전히 개선의 여지가 있으며, 특히 구조적 무결성과 같은 통계적 특성을 활용하여 생성 샘플의 충실도를 높일 수 있다."
"가산 가우시안 잡음과 예측된 잡음 사이의 평균 제곱 오차를 최소화하는 것만으로는 예측된 잡음이 등방성을 가지도록 강제하지 않는다."