이 논문은 실험 데이터에 대한 효율적인 적응을 위한 새로운 방법인 순방향 전달 기반 모델 적응(FOA)을 제안한다. 기존의 역전파 기반 테스트 시간 적응(TTA) 방법은 자원 제한적인 장치에서 사용하기 어려운 문제가 있다. 이를 해결하기 위해 FOA는 다음과 같은 접근법을 취한다:
모델 매개변수를 수정하지 않고 새로운 프롬프트를 모델의 입력으로 추가하여 적응한다. 이를 위해 코변량 행렬 적응 진화 전략(CMA-ES)이라는 미분 없는 최적화 기법을 사용한다.
CMA-ES가 안정적으로 작동할 수 있도록 모델 예측 엔트로피와 활성화 통계 간 차이를 측정하는 새로운 적합도 함수를 설계한다.
활성화 시프팅 기법을 추가로 적용하여 실험 데이터의 활성화를 소스 도메인 방향으로 조정함으로써 적응 성능을 더욱 향상시킨다.
실험 결과, FOA는 기존 역전파 기반 TTA 방법보다 우수한 성능을 보이며, 특히 양자화된 모델에서도 효과적으로 작동한다. 또한 메모리 사용량이 크게 감소하여 자원 제한적인 장치에 적용할 수 있다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Shuaicheng N... kl. arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01650.pdfDybere Forespørgsler