핵심 개념
본 연구는 기존 학습 데이터에 없는 새로운 객체를 감지하고 이를 기존 클래스와의 유사성을 기반으로 구분하는 개방형 의미 분할 기법을 제안한다.
초록
이 논문은 개방형 의미 분할 문제를 다룹니다. 입력 이미지에서 학습 데이터에 없었던 새로운 객체를 감지하고 이를 기존 클래스와의 유사성을 기반으로 구분하는 것이 목표입니다.
제안하는 접근법은 인코더-디코더 구조의 합성곱 신경망으로 구성됩니다. 첫 번째 디코더는 기존 클래스에 대한 정확한 의미 분할을 수행하며, 각 클래스의 특징 벡터를 학습합니다. 두 번째 디코더는 알려진 클래스와 알려지지 않은 클래스를 구분하는 이진 이상치 분할을 수행합니다.
이 두 결과를 결합하여 최종적인 개방형 의미 분할을 얻습니다. 또한 각 새로운 클래스와 가장 유사한 기존 클래스를 제공합니다.
실험 결과, 제안 방법은 이상치 분할 분야에서 최첨단 성능을 보이며, 기존 클래스에 대한 의미 분할 성능도 유지합니다. 또한 서로 다른 새로운 클래스를 구분하고 기존 클래스와의 유사성을 제공할 수 있습니다.
통계
입력 이미지의 픽셀 수는 H x W입니다.
정답 마스크 Y는 1부터 K 사이의 정수 값을 가집니다.
예측 마스크 Ŷ도 1부터 K 사이의 정수 값을 가집니다.
Ω_k는 정답 마스크에서 클래스 k에 해당하는 픽셀 집합입니다.
Ω̂_k는 예측 마스크에서 클래스 k에 해당하는 픽셀 집합입니다.
인용구
"자율 주행 시스템은 주변 환경을 이해해야 안정적으로 작동할 수 있습니다. 따라서 센서 데이터에 기반한 의미 장면 이해가 핵심적입니다."
"기존 학습 데이터에 없는 새로운 객체가 등장하는 개방형 환경을 고려해야 합니다. 이러한 상황에서 시스템은 새로운 객체를 식별하고 더 보수적인 작동 모드로 전환할 수 있어야 합니다."