本研究では、ハイパーボリックグラフニューラルネットワーク(Seg-HGNN)を提案し、教師なしかつ軽量な画像セグメンテーションを実現している。
まず、画像をパッチに分割し、各パッチを頂点とするグラフを構築する。次に、事前学習済みのビジョントランスフォーマーを用いてパッチ特徴を抽出し、それらをハイパーボリック空間に射影する。その後、ハイパーボリックグラフニューラルネットワークを用いて、グラフ上の特徴を学習し、正規化カット基準に基づいて教師なしクラスタリングを行う。これにより、物体の位置や領域を特定することができる。
提案手法は、VOC-07、VOC-12のオブジェクト位置推定タスクで現状最高の教師なし手法を2.5%、4%上回り、CUB-200、ECSSDのオブジェクトセグメンテーションタスクでも0.8%、1.3%の精度向上を達成している。さらに、7.5k未満の極めて少ない学習パラメータで高速な推論(2枚/秒)を実現しており、リソース制約の厳しいエッジデバイスでの利用が期待できる。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Debjyoti Mon... at arxiv.org 09-11-2024
https://arxiv.org/pdf/2409.06589.pdfDeeper Inquiries