自己教師付き学習(SSL)は、未ラベル化されたデータから強力な視覚的表現を学習する方法です。本論文では、生成モデルを使用してセマンティックに一貫した画像拡張を生成する新しいフレームワークが紹介されています。これにより、多様な拡張が可能となり、自己教師付き学習のトレーニングデータの多様性が向上します。ICGANとStable Diffusionモデルを使用した実験結果は、生成変換が視覚的表現学習に効果的であることを示しています。特にStable Diffusionは高品質な画像を生成し、他の手法よりも優れた結果を示しています。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Arash Afkanp... في arxiv.org 03-12-2024
https://arxiv.org/pdf/2403.05966.pdfاستفسارات أعمق