Core Concepts
CoLLEGe는 소수의 예문을 사용하여 새로운 개념 토큰에 대한 유연하고 표현력 있는 임베딩을 생성할 수 있는 메타 학습 프레임워크이다.
Abstract
이 논문은 대규모 언어 모델(LLM)이 새로운 개념을 빠르게 학습할 수 있도록 하는 CoLLEGe 프레임워크를 소개한다. CoLLEGe는 소수의 예문을 사용하여 새로운 개념 토큰에 대한 유연하고 표현력 있는 임베딩을 생성할 수 있는 메타 학습 프레임워크이다.
주요 내용은 다음과 같다:
현재 언어 모델은 새로운 개념을 빠르게 학습하기 어려우며, 미세 조정 과정이 필요하다. 문맥 내 프롬팅은 문맥 방해에 강하지 않으며, 새로운 개념에 대한 정보를 많이 전달하지 못한다.
CoLLEGe는 소수의 예문 또는 정의를 사용하여 새로운 개념에 대한 유연한 임베딩을 생성할 수 있는 메타 학습 프레임워크이다. 주요 메타 학습 목표는 언어 모델의 다음 단어 예측을 용이하게 하는 것이다.
새로운 개념 학습을 평가하기 위해 새로운 단어 획득, 정의 추론, 언어 추론 등의 과제를 설계했다. CoLLEGe는 이러한 과제에서 추가 학습 없이 우수한 성능을 보였다.
예제 버퍼, 부정적 예제 샘플링, 지식 증류 등의 기술이 CoLLEGe의 성능 향상에 기여했다.
Stats
새로운 개념 토큰을 포함하는 문장에서 추출한 통계 수치는 다음과 같다:
"새로운 개념 토큰을 포함하는 문장에서 추출한 통계 수치는 다음과 같습니다."
새로운 개념 토큰을 포함하는 문장에서 추출한 중요 수치는 다음과 같습니다:
"새로운 개념 토큰을 포함하는 문장에서 추출한 중요 수치는 다음과 같습니다."
Quotes
"새로운 개념 토큰을 포함하는 문장에서 추출한 중요한 인용구는 다음과 같습니다."
"새로운 개념 토큰을 포함하는 문장에서 추출한 중요한 인용구는 다음과 같습니다."