核心概念
제안된 에너지 기반 보정 VAE(EC-VAE) 모델은 VAE의 생성 방향을 개선하여 고품질의 이미지를 생성할 수 있습니다. EC-VAE는 조건부 에너지 기반 모델(EBM)을 활용하여 VAE의 생성 방향을 보정하며, 테스트 시 MCMC 샘플링이 필요하지 않습니다.
摘要
이 논문에서는 에너지 기반 보정 VAE(EC-VAE)라는 새로운 생성 모델을 제안합니다. VAE는 생성 방향에 대한 명시적인 최적화가 부족하여 흐릿하거나 왜곡된 샘플을 생성하는 문제가 있습니다. 반면 EBM은 고품질의 샘플을 생성할 수 있지만 느린 MCMC 샘플링이 필요합니다.
EC-VAE는 이러한 문제를 해결하기 위해 조건부 EBM을 도입하여 VAE의 생성 방향을 보정합니다. 구체적으로 VAE에서 생성된 샘플을 입력으로 하여 MCMC 샘플링을 수행하고, 생성된 샘플과 보정된 샘플 간의 거리를 최소화하는 방식으로 VAE의 생성 방향을 보정합니다. 이를 통해 테스트 시 MCMC 샘플링 없이도 고품질의 샘플을 생성할 수 있습니다.
또한 저자들은 에너지 기반 보정 아이디어를 변분 학습과 정규화 흐름에도 적용하였으며, 제로 샷 이미지 복원 문제에도 적용하였습니다. 실험 결과, EC-VAE는 다양한 데이터셋에서 기존 VAE, EBM, 그리고 GAN 모델들을 크게 능가하는 성능을 보였습니다.
統計資料
생성된 샘플과 보정된 샘플 간의 거리를 최소화하는 것이 핵심 아이디어입니다.
제안된 EC-VAE 모델은 CIFAR-10 데이터셋에서 FID 5.20을 달성하여 기존 모델들을 크게 능가했습니다.
EC-VAE는 단일 단계 비대립 생성 방식으로도 GAN 및 확산 모델들과 경쟁할 수 있는 성능을 보였습니다.
引述
"VAEs often suffer from blurry generated samples due to the lack of a tailored training on the samples generated in the generative direction."
"EBMs can generate high-quality samples but require expensive Markov Chain Monte Carlo (MCMC) sampling."
"We introduce a conditional EBM for calibrating the generative direction of VAE during training, without requiring it for the generation at test time."