本研究は、低shot画像分類の課題に取り組むものである。従来の手法では、CLIP等の単一の事前学習モデルを活用するものが多かったが、それらでは他の事前学習モデルが持つ補完的な知識を活用できないという課題があった。
本研究では、ガウシアンプロセスを用いることで、CLIP及び複数の事前学習モデルの知識を統合的に活用する手法を提案する。具体的には、ガウシアンプロセスのカーネル関数にCLIPや他の事前学習モデルに基づく深層カーネルを組み合わせ、また、CLIPの zero-shot分類器を平均関数に組み込むことで、事前知識を効果的に取り入れている。
提案手法は、ImageNetを含む複数の標準ベンチマークデータセットで、既存の手法を上回る性能を示した。また、提案手法は、out-of-distribution (OOD)データに対する頑健性や、予測の不確実性推定の質が高いことも確認された。さらに、モデルの校正性についても優れた結果が得られた。
以上より、本研究は、ベイズ的手法を活用することで、事前学習モデルの知識を効果的に統合し、低shot画像分類の性能を向上させることに成功した。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Yibo Miao,Yu... alle arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00312.pdfDomande più approfondite