핵심 개념
GraphVL이라는 새로운 프레임워크를 사용하여 라벨이 지정되지 않은 이미지를 알려진 클래스와 새로운 클래스로 클러스터링하는 작업에서 기존 방법보다 우수한 성능을 달성했습니다.
초록
GraphVL: 일반화된 클래스 발견을 위한 비전-언어 모델 기반 그래프 강화 의미 모델링 연구 논문 요약
Bhupendra Solanki, Ashwin Nair, Mainak Singha, Souradeep Mukhopadhyay, Ankit Jha, and Biplab Banerjee. 2024. GraphVL: Graph-Enhanced Semantic Modeling via Vision-Language Models for Generalized Class Discovery. In Indian Conference on Computer Vision Graphics and Image Processing (ICVGIP 2024), December 13–15, 2024, Bengaluru, India. ACM, New York, NY, USA, 10 pages. https://doi.org/10.1145/3702250.3702266
본 연구 논문에서는 라벨이 지정되지 않은 이미지들을 알려진 클래스와 새로운 클래스로 분류하는 일반화된 클래스 발견 (GCD) 문제를 다룹니다. 특히, 사전 훈련된 비전-언어 모델인 CLIP을 활용하여 기존 GCD 모델의 편향 문제를 해결하고, 새로운 클래스에 대한 클러스터링 성능을 향상시키는 것을 목표로 합니다.