Core Concepts
사용자 상호작용을 활용하여 세그먼트 어니씽 모델을 새로운 도메인에 적응시킬 수 있는 방법을 제시한다.
Abstract
이 논문은 세그먼트 어니씽 모델(SAM)의 성능을 다양한 데이터셋에서 평가하고, 새로운 도메인에 적용할 때 발생하는 한계를 보여준다. 특히 일반적인 소비자 이미지와 다른 희귀 객체 및 의료 이미지 데이터셋에서 SAM의 실패율이 높은 것을 확인했다.
이를 해결하기 위해 저자들은 사용자 상호작용을 활용하여 SAM을 실시간으로 적응시키는 방법을 제안한다. 구체적으로 다음과 같은 기법을 사용한다:
사용자의 클릭 정보를 활용하여 가짜 레이블을 생성하고, 이를 이용해 모델의 디코더 부분을 최적화한다.
사용자가 완성한 결과 마스크를 활용하되, 경계 영역의 오류를 방지하기 위해 침식 연산을 수행한다.
다중 클래스 객체를 처리하기 위해 디코더 부분을 복사하여 각각 적응시킨다.
이러한 방법을 통해 저자들은 다양한 데이터셋에서 SAM의 실패율을 최대 48.1% 감소시킬 수 있었다. 또한 클릭 수도 최대 46.6% 감소시켰다. 이를 통해 SAM의 적용 범위를 일반 소비자 이미지 외에도 희귀 객체와 의료 이미지 데이터셋으로 확장할 수 있음을 보여주었다.
Stats
세그먼트 어니씽 모델(SAM)은 일반 소비자 이미지 외에 희귀 객체와 의료 이미지 데이터셋에서 실패율이 최대 72.6%에 달한다.
제안 방법을 통해 실패율을 최대 48.1% 감소시킬 수 있었다.
제안 방법을 통해 클릭 수를 최대 46.6% 감소시킬 수 있었다.
Quotes
"Though being trained extensively and with the explicit purpose of serving as a foundation model, we show significant limitations of SAM when being applied for interactive segmentation on novel domains or object types."
"The presented method causes a relative reduction of up to 48.1% in the FR20@85 and 46.6% in the FR30@90 metrics."