이 논문에서는 KnowCoder라는 대규모 언어 모델을 제안한다. KnowCoder는 코드 생성을 통해 범용 정보 추출(UIE)을 수행한다.
첫째, KnowCoder는 코드 스타일의 스키마 표현 방법을 도입하여 다양한 스키마를 Python 클래스로 통일적으로 변환한다. 이를 통해 UIE 작업에서의 개념 간 관계와 제약 사항 등을 언어 모델이 이해하기 쉬운 방식으로 포착할 수 있다. 또한 30,000개 이상의 지식 유형을 포함하는 대규모 코드 스타일 스키마 라이브러리를 구축하였다.
둘째, KnowCoder는 두 단계의 학습 프레임워크를 제안한다. 먼저 코드 사전 학습을 통해 스키마 이해 능력을 향상시키고, 이후 지침 미세 조정을 통해 특정 스키마를 따르는 능력을 향상시킨다. 이를 통해 KnowCoder는 다양한 IE 작업에서 뛰어난 성능을 보인다.
실험 결과, KnowCoder는 제로 샷 및 저 자원 설정에서 기존 최신 모델 대비 각각 12.5%, 21.9%의 성능 향상을 달성했다. 또한 다양한 사람 주석 데이터셋을 활용하여 추가 학습한 결과, 관계 추출 작업에서 최대 7.5%의 성능 향상을 보였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문