이 논문은 약한 감독 하의 의미론적 분할 문제를 다룬다. 기존 CNN 기반 접근법은 클래스 특정적 부분에 초점을 맞추는 반면, ViT 기반 접근법은 의미론적 부분을 잘 포착하지만 클래스 특정성이 부족하다는 한계가 있다.
저자들은 이러한 상호보완적 특성을 활용하기 위해 Complementary Branch (CoBra)라는 새로운 이중 분기 프레임워크를 제안한다. CoBra는 CNN 분기와 ViT 분기로 구성되며, 각 분기는 상대방의 보완적 지식을 활용하여 클래스 인식과 의미론적 이해를 향상시킨다.
구체적으로, CNN 분기는 Class-Aware Projection (CAP)을 통해 ViT 분기에 클래스 지식을 제공하고, ViT 분기는 Semantic-Aware Projection (SAP)을 통해 CNN 분기에 의미론적 지식을 제공한다. 이를 통해 두 분기가 상호보완적으로 발전하여 강건한 약한 감독 하의 의미론적 분할 결과를 도출한다.
저자들은 PASCAL VOC 2012와 MS COCO 2014 데이터셋에서 실험을 수행하여, 제안 모델이 기존 최신 기법들을 능가하는 우수한 성능을 보임을 입증한다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Woojung Han,... ב- arxiv.org 03-15-2024
https://arxiv.org/pdf/2403.08801.pdfשאלות מעמיקות