この論文では、CLIPを使用した新しい無監督学習方法であるCDULが提案されています。CDULは、画像全体と各スニペットのグローバルおよびローカルな類似性ベクトルを統合するアグリゲーション戦略を使用して、高品質な擬似ラベルを生成し、これらの擬似ラベルを使用して分類ネットワークをトレーニングします。実験結果は、CDULが最先端の無監督学習方法よりも優れたパフォーマンスを達成することを示しています。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Rabab Abdelf... às arxiv.org 03-08-2024
https://arxiv.org/pdf/2307.16634.pdfPerguntas Mais Profundas