Core Concepts
본 연구는 고해상도 SAR 영상에서 전력 송전탑을 효과적으로 탐지하기 위해 프롬프트 학습 기반의 새로운 모델 P2Det를 제안한다. P2Det는 다중 모달 데이터 융합 모듈과 형상 적응형 정제 모듈을 통해 배경 간섭을 완화하고 정확한 탐지를 달성한다.
Abstract
본 연구는 고해상도 SAR 영상에서 전력 송전탑을 효과적으로 탐지하기 위한 새로운 모델 P2Det를 제안한다.
다중 모달 데이터 융합 모듈(MDF):
영상 임베딩과 프롬프트 임베딩을 생성하여 융합
두 모달 간 상호 관계를 학습하는 두 방향 융합 모듈(TWFM) 도입
형상 적응형 정제 모듈(SARM):
동적 IoU 임계값 설정을 통해 종횡비 정보 활용
정규화된 형상 거리를 이용한 샘플 품질 평가
실험 결과:
제안 모델 P2Det는 다양한 배경 환경(도시, 농지, 산림, 산악 지역 등)에서 우수한 성능 달성
기존 방법 대비 AP75 90.3%, AR50 99.1%의 높은 정확도와 재현율 달성
본 연구는 프롬프트 학습과 다중 모달 데이터 융합을 통해 고해상도 SAR 영상에서 전력 송전탑 탐지 성능을 크게 향상시켰다.
Stats
전력 송전탑의 위치와 형상 정보는 탐지 성능에 중요한 영향을 미친다. 제안 모델 P2Det는 다음과 같은 통계 지표를 활용하여 우수한 성능을 달성하였다:
AP50: 90.6%
AP75: 90.3%
AR50: 99.1%
AR75: 93.2%
Quotes
"프롬프트 학습은 고정된 위치의 객체 탐지에 효과적이며, 우리는 희소 프롬프트 인코더와 두 방향 융합 모듈을 제안하여 프롬프트 정보를 활용한다."
"형상 적응형 정제 모듈은 동적 IoU 임계값과 정규화된 형상 거리를 이용하여 샘플 선택 전략을 개선함으로써 탐지 성능을 향상시킨다."