核心概念
ノイズラベルを活用したマルチモーダル事前学習手法CromSSを提案し、リモートセンシング画像セグメンテーションタスクにおいて高い性能を実現した。
要約
本研究では、ノイズラベルを活用したマルチモーダル事前学習手法CromSSを提案した。CromSSは、Sentinel-1レーダーデータとSentinel-2マルチスペクトルデータの2つのモダリティを活用し、モダリティ間の一貫性と各モダリティの信頼性を考慮してサンプル選択を行う。
事前学習段階では、各モダリティのU-Netモデルを用いて特徴抽出とクラス確率マスクの生成を行う。その後、モダリティ間の共有情報を強化することで、サンプル選択マスクを生成する。これにより、ノイズラベルの悪影響を軽減しつつ、モダリティ間の相互学習を促進する。
実験では、Sentinel-1/2データとGoogle Dynamic Worldプロジェクトのノイズラベルを用いて事前学習を行い、DFC2020データセットでの転移学習を評価した。その結果、提案手法CromSSが単一モーダルの事前学習や既存の自己教師あり学習手法と比べて優れた性能を示すことを確認した。特に、Sentinel-2マルチスペクトルデータにおいて大きな改善が見られた。
今後の課題として、ビジョントランスフォーマーを用いたマスクドイメージモデリングへの適用や、さまざまなタイプのノイズラベルに対する頑健性の検証などが挙げられる。
統計
Sentinel-1とSentinel-2の4シーズンのデータを使用し、103,793の位置でGoogle Dynamic Worldのノイズラベルと対応付けている。
DFC2020データセットの986個の検証パッチを学習データ、5,128個のテストパッチをテストデータとして使用した。
引用
"ノイズラベルを活用したマルチモーダル事前学習手法CromSSを提案し、リモートセンシング画像セグメンテーションタスクにおいて高い性能を実現した。"
"特に、Sentinel-2マルチスペクトルデータにおいて大きな改善が見られた。"