이 논문은 장기 꼬리 분포 문제를 해결하기 위한 새로운 접근법인 LDMLR(Latent-based Diffusion Model for Long-tailed Recognition)을 제안한다.
첫째, 기준 모델을 사용하여 불균형 데이터셋의 특징을 인코딩한다.
둘째, 이 인코딩된 특징을 사용하여 Denoising Diffusion Implicit Model(DDIM)을 학습하고 의사 특징을 생성한다.
셋째, 인코딩된 특징과 의사 특징을 모두 사용하여 분류기를 미세 조정한다.
실험 결과, LDMLR은 CIFAR-LT와 ImageNet-LT 데이터셋에서 기준 모델 대비 성능 향상을 보였다. 이는 확산 모델의 강력한 생성 능력을 장기 꼬리 분포 문제에 성공적으로 적용한 것을 보여준다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor