本研究では、ノイズラベルを活用したマルチモーダル事前学習手法CromSSを提案した。CromSSは、Sentinel-1レーダーデータとSentinel-2マルチスペクトルデータの2つのモダリティを活用し、モダリティ間の一貫性と各モダリティの信頼性を考慮してサンプル選択を行う。
事前学習段階では、各モダリティのU-Netモデルを用いて特徴抽出とクラス確率マスクの生成を行う。その後、モダリティ間の共有情報を強化することで、サンプル選択マスクを生成する。これにより、ノイズラベルの悪影響を軽減しつつ、モダリティ間の相互学習を促進する。
実験では、Sentinel-1/2データとGoogle Dynamic Worldプロジェクトのノイズラベルを用いて事前学習を行い、DFC2020データセットでの転移学習を評価した。その結果、提案手法CromSSが単一モーダルの事前学習や既存の自己教師あり学習手法と比べて優れた性能を示すことを確認した。特に、Sentinel-2マルチスペクトルデータにおいて大きな改善が見られた。
今後の課題として、ビジョントランスフォーマーを用いたマスクドイメージモデリングへの適用や、さまざまなタイプのノイズラベルに対する頑健性の検証などが挙げられる。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania