この論文では、CLIPを使用した新しい無監督学習方法であるCDULが提案されています。CDULは、画像全体と各スニペットのグローバルおよびローカルな類似性ベクトルを統合するアグリゲーション戦略を使用して、高品質な擬似ラベルを生成し、これらの擬似ラベルを使用して分類ネットワークをトレーニングします。実験結果は、CDULが最先端の無監督学習方法よりも優れたパフォーマンスを達成することを示しています。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Rabab Abdelf... kl. arxiv.org 03-08-2024
https://arxiv.org/pdf/2307.16634.pdfDybere Forespørgsler