Core Concepts
OmniSatは、地球観測データの異なるモダリティを自己教師あり学習で融合し、より表現力の高い多モーダル表現を学習する新しいアーキテクチャである。
Abstract
本論文では、OmniSatと呼ばれる新しいアーキテクチャを提案している。OmniSatは、地球観測データの異なるモダリティ(高解像度画像、光学時系列、レーダー時系列)を自己教師あり学習で融合し、より表現力の高い多モーダル表現を学習することができる。
具体的には以下の特徴がある:
- 空間的に整列した複数のモダリティを活用し、モダリティ間の対比学習と再構成学習を組み合わせることで、各モダリティの特徴を捉えた表現を学習する。
- 既存の地球観測データセットにさらに新しいモダリティを追加し、3つのモダリティを含む初の地球観測データセットを作成した。
- 提案手法は、木種分類、作物分類、土地被覆分類などの下流タスクで、単一モダリティを使う場合でも性能を向上させることができる。
- 提案手法は、既存手法と比べてより小さなモデルサイズで高速に学習でき、優れた性能を示す。
以上のように、OmniSatは地球観測データの自己教師あり学習による多モーダル融合の新しいアプローチを示しており、幅広い応用が期待できる。
Stats
単一モダリティでは、Sentinel-2時系列を使った場合、提案手法のOmniSatは10%の教師データでも17.5%、100%の教師データでも13.2%性能が向上した。
全モダリティを使った場合、OmniSatは既存手法より3.7%から5.3%高い性能を示した。
Quotes
"OmniSatは、地球観測データの異なるモダリティを自己教師あり学習で融合し、より表現力の高い多モーダル表現を学習する新しいアーキテクチャである。"
"提案手法は、木種分類、作物分類、土地被覆分類などの下流タスクで、単一モダリティを使う場合でも性能を向上させることができる。"
"OmniSatは、既存手法と比べてより小さなモデルサイズで高速に学習でき、優れた性能を示す。"