Основні поняття
대규모 언어 모델(LLM)의 지식 편집에서 발생하는 파급 효과를 해결하기 위해 체인-오브-쏘트 추론을 통합한 새로운 인컨텍스트 학습(ICL) 편집 접근 방식인 RIPPLECOT을 소개합니다.
Анотація
RIPPLECOT: 체인-오브-쏘트 인컨텍스트 학습을 통한 지식 편집의 파급 효과 증폭
본 연구는 대규모 언어 모델(LLM)에서 지식 편집 시 발생하는 파급 효과를 효과적으로 해결하는 것을 목표로 합니다. 특히, 단일 사실 편집 시 모델이 관련된 사실들을 정확하게 업데이트하는 데 어려움을 겪는 문제를 해결하고자 합니다.
본 연구에서는 체인-오브-쏘트(COT) 추론을 인컨텍스트 학습(ICL) 프레임워크에 통합한 새로운 접근 방식인 RIPPLECOT을 제안합니다. RIPPLECOT은 데모를 {새로운 사실, 질문, 사고, 답변}으로 구성하여 질문 내에서 다중 홉 논리를 식별하고 분해하는 사고 구성 요소를 통합합니다.
RIPPLECOT의 주요 기능
자동 COT 데모 생성 및 개선: RIPPLECOT은 인간의 개입을 최소화하면서 관련성이 높은 데모를 자동으로 생성하고 개선합니다.
다중 편집 시나리오 지원: RIPPLECOT은 여러 번의 지식 업데이트가 필요한 상황에서도 효과적으로 작동합니다.
기존 지식 편집 방법과의 통합: RIPPLECOT은 기존 방법과 통합되어 파급 효과 성능을 더욱 향상시킬 수 있습니다.