Conceptos Básicos
본 연구는 제한된 데이터 환경에서 미분류 선박 범주에 대한 분류 정확도를 향상시키기 위해 비전-언어 모델의 잠재력을 활용하는 방법을 제안한다.
Resumen
본 연구는 세부적인 선박 분류(RS-FGSC)의 과제를 해결하기 위해 비전-언어 모델(VLM)을 활용하는 방법을 제안한다.
- RS-FGSC는 클래스 간 유사성이 높고 레이블된 데이터가 제한적이어서 기존 감독 학습 방법의 효과가 제한적이다.
- VLM은 적은 데이터로도 우수한 성능을 보이는 것으로 알려져 있다.
- 그러나 VLM을 직접 미세 조정하면 관찰된 클래스에 과적합되어 미분류 클래스에 대한 일반화 성능이 저하된다.
- 이를 해결하기 위해 계층적이고 다중 수준의 프롬프트 설계와 원격 감지 선박 사전 지식을 통합하는 새로운 프롬프트 미세 조정 기법을 제안한다.
- 이를 통해 복잡한 배경을 구분하고 식별 가능한 선박 특징을 학습할 수 있다.
- 또한 FGSCM-52라는 새로운 데이터셋을 소개하여 기존 데이터셋의 한계를 극복하고자 한다.
- 실험 결과, 제안 방법이 기존 최신 기법들을 크게 능가하는 것으로 나타났다.
Estadísticas
본 연구에서 사용한 FGSC-23 데이터셋은 4,052개의 선박 이미지로 구성되어 있다.
FGSCR-42 데이터셋은 9,320개의 이미지와 42개의 클래스로 구성되어 있다.
제안한 FGSCM-52 데이터셋은 FGSCR-42를 확장한 것으로, 52개의 클래스와 더 많은 샘플을 포함하고 있다.
Citas
"Fine-grained ship classification in remote sensing (RS-FGSC) poses a significant challenge due to the high similarity between classes and the limited availability of labeled data, limiting the effectiveness of traditional supervised classification methods."
"Directly fine-tuning VLMs for RS-FGSC often encounters the challenge of overfitting the seen classes, resulting in suboptimal generalization to unseen classes, which highlights the difficulty in differentiating complex backgrounds and capturing distinct ship features."