본 논문에서는 깊이 지향 주의력을 활용하여 Cycle GAN 모델을 개선하여 수중 이미지의 대비를 향상시키는 방법을 제안합니다.
이 논문은 물리 기반 합성 수중 이미지 데이터셋(PHISWID)을 소개하며, 이를 통해 수중 이미지 처리 기술을 향상시키고자 한다.
본 논문은 다중 스케일 트랜스포머 기반의 UWFormer 모델을 제안하여 반자동 학습을 통해 수중 이미지의 질을 향상시킨다. 이를 위해 비선형 주파수 인지 주의 메커니즘과 다중 스케일 융합 피드포워드 네트워크를 도입하였으며, 수중 환경에 특화된 준지도 학습 전략을 사용하였다.
UWFormer는 다중 주파수 향상을 위한 반지도 학습 기반 다중 스케일 트랜스포머 모델로, 비선형 주파수 인지 주의 메커니즘과 다중 스케일 융합 피드포워드 네트워크를 통해 수중 이미지의 색상, 대비, 선명도를 효과적으로 향상시킨다.