Основные понятия
기존 지식 그래프 완성 모델의 한계를 극복하기 위해, 본 논문에서는 풍부한 컨텍스트 정보를 활용하는 LLM 기반 프레임워크인 KGR3를 제안하며, 이를 통해 보다 정확하고 효율적인 지식 그래프 완성이 가능함을 보여줍니다.
Аннотация
KGR3: 컨텍스트 강화 추론 및 재순위화 기반 지식 그래프 완성 프레임워크
본 논문에서는 지식 그래프 완성(KGC) 작업을 위한 새로운 프레임워크인 KGR3를 제안합니다. KGR3는 기존 임베딩 기반 방법과 텍스트 기반 방법의 한계를 해결하기 위해 컨텍스트 정보를 활용하는 LLM 기반 프레임워크입니다.
기존 방법의 한계
- 임베딩 기반 방법: 지식 그래프(KG)의 트리플 정보에만 의존하여 관계 패턴과 롱테일 엔티티에 취약합니다.
- 텍스트 기반 방법: KG 트리플과 자연어 사이의 의미적 차이를 완전히 해소하지 못합니다.
KGR3 프레임워크
KGR3는 검색, 추론, 재순위화 세 가지 모듈로 구성됩니다.
- 검색: 주어진 쿼리 트리플과 관련된 지원 트리플을 KG에서 수집하고, 기본 임베딩 모델에서 후보 답변을 수집하며, 각 관련 엔티티에 대한 컨텍스트를 검색합니다.
- 추론: 사전 학습된 LLM을 사용하여 각 쿼리 트리플에 대한 잠재적 답변을 생성합니다.
- 재순위화: 위의 두 모듈에서 생성된 후보 답변을 결합하고, LLM을 미세 조정하여 최상의 답변을 제공합니다.
KGR3의 장점
- 컨텍스트 활용: 엔티티 레이블, 설명, 별칭과 같은 컨텍스트 정보를 활용하여 KG 트리플과 자연어 사이의 의미적 차이를 해소합니다.
- LLM 기반 추론: LLM의 뛰어난 의미 이해 및 컨텍스트 학습 능력을 활용하여 정확한 답변을 생성합니다.
- 플러그 앤 플레이: 기존 KGC 모델을 재학습 없이 KGR3 프레임워크에 통합할 수 있습니다.
실험 결과
FB15k237 및 WN18RR 데이터셋을 사용한 실험 결과, KGR3는 다양한 기본 KGC 모델 및 백본 LLM과 함께 사용할 때 기존 방법보다 성능이 크게 향상되었습니다. 특히, KGR3의 최적 변형은 두 데이터셋에서 Hits@1 성능이 각각 12.3%, 5.6% 향상되었습니다.
결론
본 논문에서 제안된 KGR3 프레임워크는 컨텍스트 정보와 LLM을 활용하여 KGC 작업의 성능을 크게 향상시켰습니다. 향후 연구에서는 귀납적 KGC 및 지식 기반 질문 답변과 같은 다른 KG 추론 작업에 LLM을 적용하는 방안을 모색할 예정입니다.
Статистика
FB15k237 데이터셋에서 Hits@1 12.3% 향상
WN18RR 데이터셋에서 Hits@1 5.6% 향상
평균 SFT 시간 28.3시간에서 9.05시간으로 단축