Core Concepts
본 논문은 소스 데이터 없이 360도 파노라마 영상의 의미 분할을 위한 효과적인 도메인 적응 기법을 제안한다. 제안 기법은 투영 방식의 다양성을 활용하여 소스 모델의 지식을 효과적으로 추출하고 타깃 도메인으로 전이한다.
Abstract
본 논문은 소스 데이터 없이 360도 파노라마 영상의 의미 분할을 위한 새로운 문제를 다룬다. 이를 위해 다음과 같은 핵심 내용을 제안한다:
소스 모델의 지식 추출:
왜곡이 적은 접선 투영(Tangent Projection, TP)과 고정 시야각 투영(Fixed FoV Projection, FFP)을 활용하여 소스 모델의 지식을 효과적으로 추출한다.
파노라마 프로토타입 적응 모듈(Panoramic Prototype Adaptation Module, PPAM)을 통해 TP와 FFP 영상에서 추출한 프로토타입을 통합하여 전역 파노라마 프로토타입을 생성한다.
PPAM을 통해 소스 모델을 미세 조정하여 왜곡과 의미 정보에 대한 인식을 높인다.
지식 전이:
예측 및 프로토타입 수준의 손실 제약을 통해 타깃 도메인으로 지식을 전이한다.
교차 이중 주의 모듈(Cross-Dual Attention Module, CDAM)을 통해 특징 수준에서 공간 및 채널 특성을 정렬하여 스타일 차이를 해결한다.
실험 결과, 제안 기법은 기존 소스 데이터 없는 도메인 적응 방법들에 비해 의미 분할 성능을 크게 향상시켰다. 또한 소스 데이터를 활용하는 도메인 적응 방법들과 비교해서도 경쟁력 있는 성능을 보였다.
Stats
70°의 좁은 시야각을 가진 핀홀 카메라와 360°의 넓은 시야각을 가진 360도 카메라 간의 의미 차이가 크다.
360도 파노라마 영상은 불가피한 왜곡이 발생한다.
핀홀 영상과 360도 파노라마 영상 간에는 스타일 차이가 존재한다.
Quotes
"Semantics, Distortion, and Style Matter: Towards Source-free UDA for Panoramic Segmentation"
"Tackling this problem is nontrivial due to the semantic mismatches, style discrepancies, and inevitable distortion of panoramic images."