本研究では、以下の取り組みを行っている:
湖沼の位置情報を表すポイント、ボックス、マスクの3種類のプロンプトデータセットを作成し、湖沼抽出のベンチマークを確立した。
提案手法「LEPrompter」は、プロンプトを活用した学習段階と、プロンプトを使わない推論段階からなる二段階のフレームワークである。プロンプト学習段階では、軽量なプロンプトエンコーダとデコーダを用いて、プロンプト情報と画像特徴を融合させる。推論時はプロンプトを使わずに自律的に湖沼を抽出する。
実験の結果、提案手法は既存手法に比べて、Surface Water (SW)データセットで91.53%、Qinghai-Tibet Plateau Lake (QTPL)データセットで97.44%のmIoUを達成し、高精度な湖沼抽出を実現した。
プロンプトの種類や数の影響を分析し、適度なプロンプト情報が学習を効果的に支援することを示した。一方で、過剰なプロンプトは性能向上を阻害する可能性がある。
総合的に、本研究は湖沼抽出の精度向上と効率化に貢献する新しい手法を提案している。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor