이 논문은 장기 꼬리 분포 문제를 해결하기 위한 새로운 접근법인 LDMLR(Latent-based Diffusion Model for Long-tailed Recognition)을 제안한다.
첫째, 기준 모델을 사용하여 불균형 데이터셋의 특징을 인코딩한다.
둘째, 이 인코딩된 특징을 사용하여 Denoising Diffusion Implicit Model(DDIM)을 학습하고 의사 특징을 생성한다.
셋째, 인코딩된 특징과 의사 특징을 모두 사용하여 분류기를 미세 조정한다.
실험 결과, LDMLR은 CIFAR-LT와 ImageNet-LT 데이터셋에서 기준 모델 대비 성능 향상을 보였다. 이는 확산 모델의 강력한 생성 능력을 장기 꼬리 분포 문제에 성공적으로 적용한 것을 보여준다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Pengxiao Han... lúc arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04517.pdfYêu cầu sâu hơn