핵심 개념
미세 조정된 비전-언어 모델(VLM)은 이미지 특징과 텍스트 속성 간의 허위 상관관계를 학습하여 제로샷 성능 저하를 초래할 수 있으며, 이 문제를 해결하기 위해 RAVL이라는 새로운 접근 방식을 제시합니다. RAVL은 지역 수준 이미지 특징을 사용하여 허위 상관관계를 식별하고 완화하여 모델의 강건성을 향상시킵니다.
초록
RAVL: 미세 조정된 비전-언어 모델에서 허위 상관관계 발견 및 완화
본 연구 논문에서는 미세 조정된 비전-언어 모델(VLM)에서 이미지 특징과 텍스트 속성 간의 허위 상관관계를 발견하고 완화하는 것을 목표로 하는 RAVL이라는 새로운 접근 방식을 제시합니다.
RAVL은 두 단계로 작동합니다. 첫째, 레이블이 지정된 분류 데이터 세트를 사용하여 이미지를 후보 영역으로 분해하고, VLM 임베딩 공간을 활용하여 시각적으로 유사한 영역을 특징 클러스터로 그룹화하고, 제로샷 분류 오류에 대한 각 특징의 영향을 정량적으로 평가하여 허위 상관관계를 발견합니다. 둘째, VLM이 하나 이상의 텍스트 속성과 허위로 상관 관계를 맺는 법을 학습한 이미지 특징의 순위가 매겨진 목록이 주어지면, RAVL은 식별된 허위 상관관계를 완화합니다. 이를 위해 VLM이 미세 조정 중에 관련 영역에 집중하고 허위 관계를 무시하도록 장려하는 새로운 영역 인식 손실 함수를 도입합니다.