本研究では、深層学習を用いた珊瑚画像のセグメンテーションに取り組んでいる。従来のアプローチでは、密に注釈付けされた画像データを用いてモデルを事前学習する必要があったが、このような大量の注釈データを取得するのは非常に時間とコストがかかる。
そこで本研究では、一般目的の基盤モデルであるDINOv2を活用し、KNNアルゴリズムを用いることで、極端に少数の点ラベルからでも高精度な拡張グラウンドトゥルースマスクを生成することができる。さらに、人間参加型のラベリングスキームを提案し、ラベル効率をさらに向上させている。
具体的には以下の通り:
本研究は、一般目的の基盤モデルを活用することで、ドメイン固有の複雑な水中画像のセグメンテーションを高精度に実現できることを示した。さらに、人間参加型のラベリングスキームを提案することで、極端に少数のラベルでも高精度なセグメンテーションが可能となった。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Scarlett Rai... : arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09406.pdfDaha Derin Sorular