이 논문은 장기 꼬리 분포 문제를 해결하기 위한 새로운 접근법인 LDMLR(Latent-based Diffusion Model for Long-tailed Recognition)을 제안한다.
첫째, 기준 모델을 사용하여 불균형 데이터셋의 특징을 인코딩한다.
둘째, 이 인코딩된 특징을 사용하여 Denoising Diffusion Implicit Model(DDIM)을 학습하고 의사 특징을 생성한다.
셋째, 인코딩된 특징과 의사 특징을 모두 사용하여 분류기를 미세 조정한다.
실험 결과, LDMLR은 CIFAR-LT와 ImageNet-LT 데이터셋에서 기준 모델 대비 성능 향상을 보였다. 이는 확산 모델의 강력한 생성 능력을 장기 꼬리 분포 문제에 성공적으로 적용한 것을 보여준다.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Pengxiao Han... às arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04517.pdfPerguntas Mais Profundas