この論文では、CLIPを使用した新しい無監督学習方法であるCDULが提案されています。CDULは、画像全体と各スニペットのグローバルおよびローカルな類似性ベクトルを統合するアグリゲーション戦略を使用して、高品質な擬似ラベルを生成し、これらの擬似ラベルを使用して分類ネットワークをトレーニングします。実験結果は、CDULが最先端の無監督学習方法よりも優れたパフォーマンスを達成することを示しています。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Rabab Abdelf... alle arxiv.org 03-08-2024
https://arxiv.org/pdf/2307.16634.pdfDomande più approfondite