Concetti Chiave
LLM 의미론의 잉여성으로 인한 정보 비대칭 문제를 해결하여 보이지 않는 도메인에서의 일반화된 제로-샷 학습을 가능하게 함
Sintesi
이 논문은 보이지 않는 도메인에서의 일반화된 제로-샷 학습(CDGZSL)을 다룹니다. 기존의 제로-샷 학습(ZSL) 및 일반화된 제로-샷 학습(GZSL) 방법은 도메인 이동 문제(DSP)를 해결하는 데 한계가 있었습니다. 이를 해결하기 위해 저자들은 CDGZSL을 제안했습니다.
CDGZSL에서는 학습 데이터가 여러 보이는 도메인의 보이는 클래스로 구성되며, 테스트 데이터는 보이지 않는 도메인의 보이는 및 보이지 않는 클래스로 구성됩니다. 기존 방법들은 LLM에서 추출한 잉여적인 의미론을 직접 사용하여 정보 비대칭 문제를 겪었습니다.
이를 해결하기 위해 저자들은 Meta Domain Alignment Semantic Refinement (MDASR)를 제안했습니다. MDASR은 두 가지 최적화 목표를 가집니다:
- Inter-class Similarity Alignment (ISA): 특징 공간의 관계를 기반으로 비내재적 의미론을 제거합니다.
- Unseen-class Meta Generation (UMG): 내재적 의미론을 보존하여 보이는 클래스와 보이지 않는 클래스 간 연결성을 유지합니다.
이를 통해 MDASR은 의미론과 특징 공간 간 정보 비대칭 문제를 해결하고, DSP를 완화하여 CDGZSL 성능을 향상시킵니다. 실험 결과, MDASR은 Office-Home과 Mini-DomainNet 데이터셋에서 기존 방법 대비 우수한 성능을 보였습니다.
Statistiche
보이는 도메인의 데이터와 보이지 않는 도메인의 데이터 간 도메인 이동 문제로 인해 보이지 않는 클래스가 보이는 클래스로 잘못 분류되는 문제가 발생한다.
기존 제로-샷 학습 방법들은 이 문제를 해결하는 데 한계가 있었다.
LLM에서 추출한 의미론은 잉여적이어서 정보 비대칭 문제를 야기했다.
Citazioni
"LLMs have the capacity to internalize vast amounts of knowledge and externalize it for application in the real world [2]."
"ZSL is designed to recognize unseen classes not present in the training set by leveraging semantic knowledge to bridge the gap between seen and unseen classes, mimicking human cognitive inference [10]–[12]."
"Generative methods such as f-CLSWGAN [18] and f-vaegan-d2 [19] have been developed, modeling between the semantic space and the feature space, generating unseen class data based on semantic knowledge to reduce model overfitting on seen classes and mitigate DSP."