核心概念
대규모 언어 모델의 프롬프트 튜닝을 위한 새로운 접근 방식인 작업 프롬프트 벡터를 소개하며, 이는 다중 작업 설정에서 효율성과 모듈성을 향상시킵니다.
要約
작업 프롬프트 벡터: 다중 작업 소프트 프롬프트 전이를 통한 효과적인 초기화
Belanec, R., Ostermann, S., Srba, I., & Bielikova, M. (2024). Task Prompt Vectors: Effective Initialization through Multi-Task Soft-Prompt Transfer. arXiv preprint arXiv:2408.01119v2.
본 연구는 대규모 언어 모델 (LLM)의 프롬프트 튜닝을 위한 효율적이고 모듈식 접근 방식인 작업 프롬프트 벡터를 소개하고, 이 벡터가 다양한 자연어 이해 (NLU) 작업에서 다중 작업 성능을 향상시키는 방법을 탐구하는 것을 목표로 합니다.