Core Concepts
제한된 레이블 데이터를 가진 타겟 도메인에서 LLM 기반 다중 레이블 분류기의 성능을 향상시키기 위해 준지도 학습 기반 도메인 적응 방법인 DALLMi를 제안한다.
Abstract
이 논문은 LLM(Large Language Model) 기반 다중 레이블 분류기의 도메인 적응 문제를 다룬다.
타겟 도메인에 레이블이 충분하지 않은 경우, LLM 기반 다중 레이블 분류기의 성능이 저하되는 문제가 있다.
이를 해결하기 위해 DALLMi라는 준지도 학습 기반 도메인 적응 방법을 제안한다.
DALLMi의 핵심 구성요소는 다음과 같다:
레이블 균형 샘플링: 각 레이블에 대해 최소 1개의 긍정 샘플이 포함되도록 샘플링
변분 손실: 긍정 샘플과 비긍정 샘플의 예측 분포 차이를 최소화하는 손실 함수
MixUp 정규화: 긍정 샘플과 비긍정 샘플의 선형 보간을 통해 합성 샘플 생성 및 정규화
3개의 데이터셋(PubMed, arXiv, Movies)에 대한 실험 결과, DALLMi가 부분 fine-tuning 및 비지도 접근법 대비 각각 19.9%, 52.2% 높은 mAP 성능을 보였다.
Stats
타겟 도메인 데이터의 50%, 70%, 90%의 레이블이 제거된 경우에도 DALLMi가 부분 fine-tuning 및 비지도 접근법 대비 높은 성능을 보였다.
특히 Movies 데이터셋에서는 완전 지도 fine-tuning보다 DALLMi의 성능이 더 높게 나타났다.
Quotes
"제한된 긍정 샘플과 대량의 비긍정 샘플을 효과적으로 활용하여 LLM 기반 다중 레이블 분류기의 성능을 향상시키는 것이 핵심 과제이다."
"DALLMi는 변분 손실과 MixUp 정규화를 통해 제한된 긍정 레이블과 대량의 비긍정 샘플을 효과적으로 활용한다."