本論文は、グラフ畳み込み射影とトーキングヘッドを活用したグラフベースのビジョントランスフォーマー(GvT)を提案している。GvTは、小規模データセットからスクラッチで学習できる優れた性能を発揮する。
主な特徴は以下の通り:
実験では、ClipArt、CIFAR-100、Oxford-IIIT Pet、Sketch-Subset、Chest X-ray、COVID-CTなどの小規模データセットで評価を行い、従来のCNNやビジョントランスフォーマーを上回る性能を示した。特に、Chest X-rayとCOVID-CTの医療画像分類タスクでも優れた結果を得ている。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Dongjing Sha... : arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04924.pdfDaha Derin Sorular