Core Concepts
제한된 데이터와 자원 환경에서도 시각적 사전 지식을 활용하여 효율적이고 성능 좋은 인스턴스 분할 모델을 학습할 수 있다.
Abstract
이 연구는 메모리 효율적이고 성능이 우수한 인스턴스 분할 프레임워크 MISS를 제안한다. MISS는 농구 경기 장면에서의 인스턴스 분할 문제를 다루며, 데이터 전처리, 증강, 학습, 추론 단계에 걸쳐 시각적 귀납적 사전 지식을 활용한다.
데이터 전처리 단계에서는 Canny-Hough 직선 검출 알고리즘을 사용하여 농구 코트의 위치를 정확히 탐지하고 이미지를 효과적으로 크롭한다. 데이터 증강 단계에서는 객체의 위치와 속성 정보를 활용하여 객체 단위로 다양한 스타일 변환을 적용한다. 학습 및 추론 단계에서는 탐지된 농구 코트 영역에 집중하여 메모리와 연산 자원을 효율적으로 사용한다.
실험 결과, MISS는 기존 방법 대비 메모리 사용량을 크게 줄이면서도 성능 저하 없이 우수한 결과를 보여주었다. 이는 시각적 사전 지식을 다양한 단계에 걸쳐 효과적으로 활용한 덕분이다. 제안된 MISS 프레임워크는 데이터와 자원이 제한된 환경에서도 강력한 인스턴스 분할 모델을 학습할 수 있는 잠재력을 보여준다.
Stats
우리 방법은 기존 방법 대비 메모리 사용량을 42.1% 수준으로 크게 줄였다.
우리 방법의 AP@0.50 성능은 0.924로, 기존 방법 대비 향상되었다.
Quotes
"제한된 데이터와 계산 자원 환경에서도 시각적 사전 지식을 활용하여 강력한 인스턴스 분할 모델을 학습할 수 있다."
"MISS 프레임워크는 데이터와 자원이 제한된 환경에서도 우수한 인스턴스 분할 성능을 보여준다."