核心概念
DINOv2基盤モデルを活用し、KNNアルゴリズムを用いることで、極端に少数の点ラベルでも高精度な拡張グラウンドトゥルースマスクを生成できる。さらに、人間参加型のラベリングスキームを提案することで、ラベル効率をさらに向上させることができる。
要約
本研究では、深層学習を用いた珊瑚画像のセグメンテーションに取り組んでいる。従来のアプローチでは、密に注釈付けされた画像データを用いてモデルを事前学習する必要があったが、このような大量の注釈データを取得するのは非常に時間とコストがかかる。
そこで本研究では、一般目的の基盤モデルであるDINOv2を活用し、KNNアルゴリズムを用いることで、極端に少数の点ラベルからでも高精度な拡張グラウンドトゥルースマスクを生成することができる。さらに、人間参加型のラベリングスキームを提案し、ラベル効率をさらに向上させている。
具体的には以下の通り:
- DINOv2の特徴ベクトルとKNNを組み合わせることで、従来手法と比べて5点ラベルの場合は22.6%、10点ラベルの場合は19.1%のmIoU精度向上を実現した。
- 人間参加型のラベリングスキームを提案し、ラベル効率をさらに向上させた。5点ラベルの場合は17.3%、10点ラベルの場合は10.6%のピクセル精度向上を達成した。
- DINOv2の特徴抽出器を用いることで、事前学習なしでも高精度なセグメンテーションが可能となった。
- ラベル数とラベル配置スタイルがセグメンテーション精度に与える影響を分析し、効率的なラベリング方法を提案した。
本研究は、一般目的の基盤モデルを活用することで、ドメイン固有の複雑な水中画像のセグメンテーションを高精度に実現できることを示した。さらに、人間参加型のラベリングスキームを提案することで、極端に少数のラベルでも高精度なセグメンテーションが可能となった。
統計
5点ラベルの場合、従来手法と比べて22.6%のmIoU精度向上
10点ラベルの場合、19.1%のmIoU精度向上
5点ラベルの場合、17.3%のピクセル精度向上
10点ラベルの場合、10.6%のピクセル精度向上
引用
"DINOv2基盤モデルを活用し、KNNアルゴリズムを用いることで、極端に少数の点ラベルでも高精度な拡張グラウンドトゥルースマスクを生成できる。"
"人間参加型のラベリングスキームを提案することで、ラベル効率をさらに向上させることができる。"