핵심 개념
통신 분야에서 대규모 언어 모델과 검색 보조 생성 시스템을 구현할 때 발생하는 고유한 과제를 해결하기 위한 Telco-RAG 프레임워크를 제안한다.
초록
이 논문은 통신 분야, 특히 3GPP 문서에 특화된 검색 보조 생성(RAG) 프레임워크인 Telco-RAG를 소개한다. Telco-RAG는 기술적 콘텐츠에 RAG 파이프라인을 구현하는 데 발생하는 핵심 과제를 해결한다.
주요 내용은 다음과 같다:
- 하이퍼파라미터 최적화: 청크 크기, 컨텍스트 길이, 임베딩 모델, 인덱싱 전략 등의 하이퍼파라미터를 최적화하여 RAG 성능을 향상시켰다.
- 쿼리 증강: 기술 용어와 약어 사전을 활용하여 쿼리를 보강하고, 생성된 후보 답변을 추가하여 쿼리 의도를 명확히 하였다.
- RAM 사용 개선: 3GPP 시리즈별로 문서를 선별적으로 로드하는 신경망 라우터를 개발하여 RAM 사용량을 45% 감소시켰다.
- 프롬프트 엔지니어링: 대화형 프롬프트 구조를 설계하여 LLM의 이해도와 응답 정확도를 높였다.
이를 통해 Telco-RAG는 통신 분야에서 LLM의 활용을 촉진하고, 다른 기술 분야의 RAG 구현을 위한 지침을 제공한다.
통계
125 토큰 청크 크기가 500 토큰 대비 2.9% 정확도 향상
텍스트 임베딩-3-large 모델이 텍스트 임베딩-ada-002 대비 2.29% 정확도 향상
후보 답변 추가로 최대 4.8% 정확도 향상
NN 라우터가 GPT-3.5와 GPT-4 대비 각각 37.8%, 11.1% 정확도 향상
인용구
"통신 분야에서 복잡한 산업 특화 지식을 마스터한 검색 보조 언어 모델은 실용적 가치가 크다."
"Telco-RAG는 통신 분야에서 AI 통합에 크게 기여할 것으로 기대된다."