Core Concepts
대규모 언어 모델(LLM)의 새로운 테스트 시간 적응(TTA) 방법인 StreamAdapter는 컨텍스트 정보를 모델 파라미터 업데이트에 직접 매핑하여 적은 수 또는 전혀 데모 없이도 새로운 작업에 빠르게 적응하거나 새로운 지식을 습득할 수 있도록 합니다.
Abstract
StreamAdapter: 컨텍스트 스트림을 이용한 효율적인 테스트 시간 적응 모델 분석
제목: StreamAdapter: 컨텍스트 스트림을 이용한 효율적인 테스트 시간 적응 모델
저자: Dilxat Muhtar1,,† Yelong Shen2,, Yaming Yang2, Xiaodong Liu2, Yadong Lu2, Jianfeng Liu2, Yuefeng Zhan2, Hao Sun2, Weiwei Deng2, Feng Sun2, Xueliang Zhang1, Jianfeng Gao2, Weizhu Chen2, Qi Zhang2
소속: 1난징대학교, 2마이크로소프트
본 논문에서는 대규모 언어 모델(LLM)의 테스트 시간 적응(Test-Time Adaptation, TTA) 성능을 향상시키기 위해 새로운 방법인 StreamAdapter를 제안합니다. 기존 In-Context Learning (ICL) 방법은 컨텍스트 창 크기에 제한이 있고 많은 데모를 필요로 하여 추론 비용이 증가하는 문제점이 있었습니다. StreamAdapter는 이러한 문제를 해결하기 위해 컨텍스트 정보를 모델 파라미터 업데이트에 직접 매핑하여 효율성을 높이고자 합니다.