本論文では、Training-Free Unsupervised Prompt (TFUP)を提案する。TFUPは、ビジョン-言語モデルの固有の表現能力を最大限に保ちつつ、類似性ベースの予測確率を用いて強化する。具体的には以下の手順を行う:
このTFUPは、ラベル付きデータを一切使わずに、元のCLIPの性能を大幅に上回る結果を達成する。さらに、TFUPをベースにトレーニングベースのアプローチ(TFUP-T)を提案し、教師なしデータに擬似ラベルと大域的な予測分布の制約を導入することで、最先端の分類性能を実現する。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Sifan Long,L... kl. arxiv.org 04-26-2024
https://arxiv.org/pdf/2404.16339.pdfDybere Forespørgsler