이 연구는 위성 영상 세그멘테이션 문제에서 다중 시간 관측 정보를 효과적으로 활용하는 방법을 탐구한다. 주요 내용은 다음과 같다:
전이 학습된 사전 학습 모델을 활용하여 전력 변전소 세그멘테이션 문제를 해결하였다. 다양한 모델 아키텍처(U-Net, ViT, SWIN)를 비교한 결과, SWIN 모델이 가장 우수한 성능을 보였다.
다중 시간 관측 정보를 활용하는 4가지 방법(단일 이미지 입력, 데이터 증강, 중간값 이미지, 잠재 특징 융합)을 비교하였다. 잠재 특징 융합 방식이 가장 효과적이었으며, 다른 방식에 비해 최대 17%의 성능 향상을 보였다.
건물 밀도 추정 문제에서도 동일한 결과를 확인하여, 제안한 방법의 일반성을 검증하였다. 이를 통해 다중 시간 관측 정보를 활용하는 효과적인 방법을 제시하였다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究