이 논문은 원격 감지 분야를 위한 강력한 비전 언어 기반 모델 RemoteCLIP을 제안한다. 기존 원격 감지 모델들은 주로 자기 지도 학습 기반의 접근법을 사용하였지만, 저수준 특징만을 학습하고 주석이 달린 데이터가 필요하다는 한계가 있었다. 또한 언어 이해 능력이 부족하여 검색 및 제로 샷 응용에 적용할 수 없었다.
이를 해결하기 위해 RemoteCLIP은 다음과 같은 방법으로 구축되었다:
특히 RSITMD와 RSICD 데이터셋에서 기존 최고 성능 대비 각각 9.14%, 8.92% 향상된 성능을 달성하였다. 제로 샷 분류에서도 기존 CLIP 대비 최대 6.39% 향상된 성능을 보였다.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Fan Liu,Delo... о arxiv.org 04-17-2024
https://arxiv.org/pdf/2306.11029.pdfГлибші Запити