Core Concepts
다양한 멀티모달 사전 학습 작업을 통해 광학 위성 이미지에 대한 일반적인 표현을 학습하는 것이 중요하다.
Abstract
이 논문은 지구 관측(EO) 데이터의 막대한 양의 레이블이 없는 데이터를 활용하기 위해 멀티모달 사전 학습 데이터셋인 MMEarth를 제안한다. MMEarth는 전 세계 1.2백만 개 위치에서 수집된 12개의 정렬된 모달리티를 포함한다. 이를 바탕으로 저자들은 Multi-Pretext Masked Autoencoder (MP-MAE) 접근법을 제안한다. MP-MAE는 ConvNeXt V2 아키텍처를 기반으로 하며, 다양한 멀티모달 사전 학습 작업을 활용한다. 실험 결과, MP-MAE는 ImageNet에서 사전 학습된 모델과 광학 위성 이미지에서 사전 학습된 모델보다 우수한 성능을 보였다. 특히 선형 프로빙 성능이 크게 향상되었다. 또한 레이블 및 매개변수 효율성 측면에서도 이점이 있음을 보였다.
Stats
전 세계 1.2백만 개 위치에서 수집된 12개의 정렬된 모달리티를 포함하는 MMEarth 데이터셋
4년(2017-2020) 동안의 데이터를 포함하여 다양성 확보
14개 생물군계에 걸쳐 균형있게 샘플링