核心概念
적응형 의미 공간 학습(ASSL) 프레임워크를 활용하여 금융 도메인의 다양한 과제를 효과적으로 학습하고 성능을 향상시킨 금융 다중 과제 대형 언어 모델 "SilverSight"를 개발하였다.
要約
이 연구는 적응형 의미 공간 학습(ASSL) 프레임워크를 제안하고, 이를 활용하여 금융 도메인의 다중 과제 대형 언어 모델 "SilverSight"를 개발하였다.
ASSL 프레임워크의 핵심 내용은 다음과 같다:
- 의미 공간 기반 클러스터링을 통해 상호 보완적이거나 상충되는 과제 데이터를 식별하고 분리한다. 이를 통해 각 전문가 모델이 자신의 전문 분야에 집중할 수 있도록 한다.
- 데이터 분포 밀도와 모델의 학습 요구를 고려하여 2단계의 적응형 데이터 선별 및 보완 과정을 거친다. 이를 통해 전체 시스템이 전체 데이터의 10%만으로도 유사한 성능을 달성할 수 있다.
- 클러스터 내 데이터 분포를 균일화하여 LoRA 전문가의 임베딩을 최적화함으로써 전문가 선택의 효율성을 높인다.
실험 결과, ASSL 프레임워크를 활용하여 개발한 "SilverSight" 모델이 금융 도메인의 다양한 과제에서 우수한 성능을 보였다. 이는 적응형 학습 기반의 의미 공간 활용이 다중 과제 대형 언어 모델의 성능 향상에 효과적임을 입증한다.
統計
전체 데이터의 10%만으로도 전체 데이터 학습과 유사한 성능을 달성할 수 있었다.
의미 공간 기반 클러스터링은 수동 분류 방식보다 우수한 성능을 보였다.
2단계 적응형 데이터 선별 및 보완 과정이 모델 성능 향상에 기여하였다.
引用
"적응형 의미 공간 학습(ASSL) 프레임워크를 활용하여 금융 도메인의 다중 과제 대형 언어 모델 "SilverSight"를 개발하였다."
"ASSL 프레임워크는 의미 공간 기반 클러스터링, 2단계 적응형 데이터 선별 및 보완, LoRA 전문가 임베딩 최적화 등의 핵심 기술을 포함한다."
"실험 결과, ASSL 프레임워크를 활용한 "SilverSight" 모델이 금융 도메인의 다양한 과제에서 우수한 성능을 보였다."