แนวคิดหลัก
ACCEPT는 사전 훈련된 언어 모델의 파라미터 효율성을 향상시키기 위해 프롬프트 임베딩을 하위 공간으로 분할하고 학습 가능한 코드워드 및 가중치를 사용하여 각 하위 프롬프트를 계산하는 새로운 프롬프트 튜닝 방법입니다.
บทคัดย่อ
ACCEPT: 합성 및 효율적인 프롬프트 튜닝을 위한 적응형 코드북
본 연구는 사전 훈련된 대규모 언어 모델(PLM)의 파라미터 효율성을 향상시키는 것을 목표로 합니다. 특히, 프롬프트 튜닝(PT) 방법에서 프롬프트 길이가 증가함에 따라 업데이트해야 하는 파라미터 수가 증가하는 문제를 해결하고자 합니다.
본 논문에서는 적응형 코드북을 사용한 합성 및 효율적인 프롬프트 튜닝(ACCEPT) 방법을 제안합니다.
PQ(Product Quantization) 개념 차용: 각각의 소프트 프롬프트가 각 하위 공간에서 학습 가능한 코드북 벡터 세트를 공유하고, 각 프롬프트는 적응형 가중치 세트로 구분됩니다.
프롬프트 임베딩 분할: 프롬프트를 여러 하위 섹션으로 나누고 각 하위 섹션에 대한 코드북을 구성하여 특정 단어가 임베딩의 전반부에서는 특정 단어와 정렬되고 후반부에서는 다른 단어와 일치할 수 있는 가능성을 고려합니다.
선형 결합을 통한 유연성 증대: 각 하위 벡터가 PQ에서처럼 하나의 코드워드에 의해서만 할당되는 것이 아니라 코드워드와 선형적으로 결합(선형 계수를 통해)될 수 있도록 하여 표현의 다양성과 유연성을 모두 높입니다.
SCPP 및 SCAP 튜닝: 프롬프트를 입력에 추가하는 방식(SCPP)과 기존 임베딩에 업데이트로 추가하는 방식(SCAP) 모두에 적용 가능하며, 두 가지 유형의 프롬프트를 결합하여 입력 길이를 줄여 학습 및 추론 효율성을 높입니다.