核心概念
본 논문에서는 대규모 언어 모델(LLM)을 활용하여 특정 작업에 유용한 합성 텍스트 데이터를 생성하는 새로운 프레임워크인 SoftSRV를 제시합니다. SoftSRV는 사람이 작성한 하드 프롬프트 템플릿을 사용하는 기존 방식과 달리 데이터 기반 학습을 통해 소프트 프롬프트를 생성하고, 이를 통해 LLM을 특정 작업에 맞게 조정하여 더욱 효과적이고 다양한 합성 데이터를 생성합니다.
摘要
SoftSRV: 대규모 언어 모델을 이용한 합성 데이터 생성을 위한 소프트 프롬프트 기반 프레임워크
본 논문에서는 대규모 언어 모델(LLM)을 사용하여 특정 작업에 유용한 합성 텍스트 데이터를 생성하는 새로운 프레임워크인 SoftSRV(Soft prompt-based Synthesis with Randomized Variation)를 제시합니다. SoftSRV는 사람이 작성한 하드 프롬프트 템플릿을 사용하는 기존 방식과 달리 데이터 기반 학습을 통해 소프트 프롬프트를 생성하고, 이를 통해 LLM을 특정 작업에 맞게 조정하여 더욱 효과적이고 다양한 합성 데이터를 생성합니다.
본 연구의 목표는 하드 프롬프트 방식의 한계점을 극복하고, LLM을 사용하여 특정 작업에 유용한 합성 데이터를 효과적으로 생성하는 새로운 프레임워크를 제시하는 것입니다.
SoftSRV는 사전 학습된 LLM을 고정하고, 소프트 프롬프트라는 매개변수화된 임베딩을 학습하여 LLM의 출력을 제어합니다. SoftSRV는 입력 텍스트 시퀀스를 임베딩하고, 이를 기반으로 소프트 프롬프트를 생성하여 LLM에 입력합니다. LLM은 소프트 프롬프트를 기반으로 새로운 텍스트 시퀀스를 생성하고, 생성된 시퀀스와 원본 시퀀스 간의 차이를 최소화하는 방식으로 소프트 프롬프트를 학습합니다.