Centrala begrepp
대규모 언어 모델을 활용하여 지식 영역 전반에 걸쳐 정보 비교를 자동화하고, 토큰 제한 및 관련 정보 유지 문제를 해결하는 새로운 시스템 ASC2End를 개발했습니다.
Sammanfattning
ASC2End 시스템은 사용자 정의 기준과 문서 요약을 비교하여 관련성을 평가하는 4개의 모듈로 구성됩니다:
- 문서 요약 (DS) 모듈:
- 금융 관련 문서 집합을 요약하여 핵심 내용을 추출합니다.
- 토큰 제한을 고려하여 효율적으로 요약을 수행합니다.
- 기준 임베딩 (CE) 모듈:
- 사용자가 정의한 지속가능 금융 기준 문서를 벡터 데이터베이스에 저장합니다.
- 유사도 검색을 위해 문서를 세그먼트로 나눕니다.
- 검색 기반 생성 (RAG) 모듈:
- 문서 요약과 기준 문서 간 유사도를 계산하여 관련 기준 문서 세그먼트를 검색합니다.
- 검색된 세그먼트와 문서 요약을 결합하여 인간 수준의 언어 모델에 전달합니다.
- 비교 평가 (CA) 모듈:
- RAG 모듈의 출력과 문서 요약을 비교하여 관련성을 평가합니다.
- 거래 정보 추출, 비교 수행, 신뢰도 점수 산출 등의 작업을 수행합니다.
실험 결과, 대규모 언어 모델 GPT-4가 Llama-2 70B 모델에 비해 우수한 성능을 보였습니다. ASC2End 시스템은 금융 분야에서 효율적인 의사결정을 지원할 수 있는 새로운 도구입니다.