Core Concepts
서브 경로 선형 근사 모델(SLAM)은 확산 모델의 추론 속도를 크게 높이면서도 높은 품질의 이미지 생성을 유지할 수 있다.
Abstract
이 논문에서는 서브 경로 선형 근사 모델(SLAM)을 제안한다. SLAM은 확산 모델의 추론 속도를 높이면서도 높은 품질의 이미지 생성을 유지할 수 있다.
SLAM은 확산 모델의 확률 흐름(PF) ODE 궤적을 선형 보간된 서브 경로로 근사화한다. 이를 통해 기존 일관성 모델의 단점인 누적 오차 증가와 개별 서브 경로 최적화의 어려움을 해결할 수 있다. SLAM은 서브 경로 선형 ODE를 활용하여 dist∆와 dist0,θ 두 가지 구성 요소에 대해 점진적이고 연속적인 추정을 수행한다. 이를 통해 누적 근사 오차를 줄이고 이미지 생성 품질을 향상시킬 수 있다.
또한 SLAM은 사전 학습된 잠재 확산 모델(예: Stable Diffusion)을 효율적으로 증류할 수 있는 방법을 제안한다. 이를 통해 더 적은 리소스로도 고품질의 생성 모델을 만들 수 있다.
실험 결과, SLAM은 기존 가속 방법들을 능가하는 성능을 보여주며, LAION, MS COCO 2014, MS COCO 2017 데이터셋에서 최신 수준의 FID와 이미지 품질을 달성한다.
Stats
SLAM은 6 A100 GPU 일 만에 고품질의 생성 모델을 만들 수 있다.
SLAM은 LAION, MS COCO 2014, MS COCO 2017 데이터셋에서 최신 수준의 FID와 이미지 품질을 달성한다.
Quotes
"SLAM adheres to the foundational concept of cumulative approximation of PF-ODE trajectories but innovates through its sustained learning from Sub-path Linear (SL) ODEs."
"SLAM employs Sub-path Linear (SL) ODEs to continuously approximate the complete PF-ODE trajectories and progressively optimize the sub-path learning objectives through the SL-ODE solutions, which could construct the denoising mappings with smaller cumulative approximated errors."
"Leveraging the proposed SLAM and SL-ODE framework, we put forth an efficient distillation method to train the model using pre-trained latent diffusion models."