Core Concepts
대조 학습을 통해 저화질 이미지와 고화질 이미지 간 도메인 격차를 해소하여 인스턴스 특정 이미지 목표 탐색 성능을 향상시킬 수 있다.
Abstract
본 연구에서는 서비스 로봇이 실제 환경에서 사용자가 제공한 고화질 쿼리 이미지와 동일한 인스턴스를 찾는 인스턴스 특정 이미지 목표 탐색 문제를 다룬다. 이 문제에서 가장 큰 어려움은 로봇이 관찰한 저화질 이미지와 사용자가 제공한 고화질 쿼리 이미지 간의 도메인 격차이다.
이를 해결하기 위해 본 연구에서는 Few-shot Cross-quality Instance-aware Adaptation (CrossIA)라는 새로운 방법을 제안한다. CrossIA는 대조 학습과 인스턴스 분류기를 활용하여 저화질 이미지와 소수의 고화질 이미지 간 도메인 불변 특징 표현을 학습한다. 또한 데이터 수집 모듈에 사전 학습된 디블러링 모델을 통합하여 관찰 이미지의 화질을 향상시킨다.
실험 결과, 제안 방법은 기존 접근법 대비 최대 3배 높은 작업 성공률을 달성했다. 이는 대조 학습과 이미지 향상 기술을 활용하여 도메인 격차를 해소하고 로봇 응용 분야의 물체 위치 탐색 성능을 높일 수 있음을 보여준다.
Stats
로봇이 관찰한 저화질 이미지와 사용자가 제공한 고화질 쿼리 이미지 간 도메인 격차가 크게 존재한다.
제안 방법은 기존 접근법 대비 최대 3배 높은 작업 성공률을 달성했다.
Quotes
"대조 학습을 통해 저화질 이미지와 고화질 이미지 간 도메인 불변 특징 표현을 학습할 수 있다."
"이미지 향상 기술을 활용하여 로봇이 관찰한 이미지의 화질을 향상시킬 수 있다."