Core Concepts
CRE-LLM은 대규모 언어 모델을 활용하여 도메인 특화 중국어 문장에서 주어진 개체 간의 관계를 효율적으로 추출하는 프레임워크이다.
Abstract
CRE-LLM은 도메인 특화 중국어 관계 추출(DSCRE) 작업을 위한 새로운 프레임워크이다. 이 프레임워크는 Llama-2, ChatGLM2, Baichuan2와 같은 오픈 소스 대규모 언어 모델(LLM)을 미세 조정하여 구축된다.
CRE-LLM은 적절한 프롬프트를 구성하고 지시 감독 미세 조정을 활용하여 모델의 논리 인식 및 생성 능력을 향상시킨다. 그리고 입력 텍스트 데이터에서 주어진 개체 간의 관계를 직접 추출한다.
CRE-LLM의 효과를 입증하기 위해 FinRE와 SanWen 두 개의 도메인 특화 DSCRE 데이터셋에 대한 광범위한 실험을 수행했다. 실험 결과, CRE-LLM이 FinRE 데이터셋에서 최신 기술 수준(SOTA) 성능을 달성하며 뛰어난 성능과 강건성을 보여주었다.
이 논문은 LLM과 트리플 구조를 결합하여 의미적으로 더 복잡한 도메인 특화 관계 추출 작업에 대한 새로운 접근 방식을 소개한다.
Stats
도메인 특화 중국어 관계 추출 작업은 복잡한 언어적 표현과 잠재적 모호성을 다루는 과제이다.
중국어 말뭉치의 제한과 중국어에서 더미 단어와 어휘소의 낮은 사용으로 인해 도메인 특화 중국어 텍스트에서 개체 간 관계를 추출하는 것이 어렵다.
Quotes
"CRE-LLM은 대규모 언어 모델을 활용하여 도메인 특화 중국어 문장에서 주어진 개체 간의 관계를 효율적으로 추출하는 프레임워크이다."
"CRE-LLM은 적절한 프롬프트를 구성하고 지시 감독 미세 조정을 활용하여 모델의 논리 인식 및 생성 능력을 향상시킨다."
"CRE-LLM의 실험 결과, FinRE 데이터셋에서 최신 기술 수준(SOTA) 성능을 달성하며 뛰어난 성능과 강건성을 보여주었다."