이 연구는 3D Swin Transformer(3D-ST)와 Spatial-Spectral Transformer(SST)의 융합을 제안한다. 3D-ST는 계층적 주목 메커니즘과 창 기반 처리를 통해 이미지 내 복잡한 공간적 관계를 잘 포착한다. 반면 SST는 자기 주목 메커니즘을 통해 장거리 의존성 모델링에 특화되어 있다.
이 연구에서는 이 두 트랜스포머의 주목 메커니즘을 통합하여 공간적 및 분광적 정보 모델링을 개선하고 보다 정확하고 신뢰할 수 있는 분류 결과를 달성한다. 또한 학습, 검증, 테스트 데이터를 엄격히 분리하여 실험을 수행함으로써 제안 방법의 강건성과 일반화 성능을 입증한다.
실험 결과, 제안 방법은 기존 방법들과 개별 트랜스포머 모델들을 크게 능가하는 성능을 보였다. 이는 두 트랜스포머의 주목 메커니즘 융합이 초분광 영상 분류에 매우 효과적임을 보여준다. 또한 비연속 샘플 활용이 제안 방법의 강건성과 신뢰성을 높이는 데 기여했음을 확인할 수 있다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Muhammad Ahm... في arxiv.org 05-03-2024
https://arxiv.org/pdf/2405.01095.pdfاستفسارات أعمق