Core Concepts
실세계 분포 변화에 대한 기반 분할 모델의 취약성을 분석하고 이를 개선하기 위한 방향을 제시한다.
Abstract
이 논문은 실세계 분포 변화에 대한 기반 분할 모델의 강건성을 분석한다. 주요 내용은 다음과 같다:
17가지 유형의 실세계 분포 변화를 모사한 MS COCO-P와 ADE20K-P 벤치마크 데이터셋을 제안했다.
7개의 최신 분할 모델(ODISE, Painter, InternImage, Segment-Anything, Mask2Former, MaskDINO, ViT-Adapter)을 대상으로 강건성을 평가했다.
분석 결과, 모든 모델이 압축 및 블러 기반 변화에 취약한 것으로 나타났다.
멀티모달 기반 모델이 유니모달 모델에 비해 일반적으로 더 강건하지는 않지만, 제로샷 설정에서 경쟁력 있는 강건성을 보였다.
멀티모달 모델은 특정 객체 범주(가전, 가구, 실외, 스포츠)에서 상대적으로 더 강건한 성능을 보였다.
변형된 이미지의 특징이 원본과 유사할수록 모델의 강건성이 높은 경향이 있다.
이 연구 결과는 기반 모델의 강건성 향상을 위한 새로운 요구사항을 제시한다.
Stats
압축 및 블러 기반 변화에서 모든 모델의 성능이 크게 저하된다.
멀티모달 모델은 제로샷 설정에서 경쟁력 있는 강건성을 보인다.
멀티모달 모델은 특정 객체 범주(가전, 가구, 실외, 스포츠)에서 상대적으로 더 강건한 성능을 보인다.
Quotes
"VFMs exhibit vulnerabilities to compression-induced corruptions"
"despite not outpacing all of unimodal models in robustness, multimodal models show competitive resilience in zero-shot scenarios"
"VFMs demonstrate enhanced robustness for certain object categories"