이 논문은 언어 모델(LLM) 사용 비용을 최소화하면서도 사용자가 정의한 정확도 수준을 보장하는 Smart 프레임워크를 소개한다.
프로파일링 단계에서는 다양한 LLM의 정확도를 참조 모델과 비교하여 평가한다. 이를 통해 사용자가 요구한 정확도 수준을 만족하는 가장 저렴한 LLM을 식별한다.
적용 단계에서는 프로파일링 결과를 바탕으로 남은 입력 데이터를 처리한다. 단일 LLM을 사용하는 것 외에도, 여러 LLM을 조합하여 사용함으로써 비용을 추가로 절감할 수 있다.
실험 결과, Smart 프레임워크는 OpenAI 모델 기준으로 최대 25.6배의 비용 절감 효과를 보였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문