대규모 언어 모델과 자기 훈련 기법을 활용하여 교과서 도메인에서 뉴스 도메인으로의 문장 패턴 구문 분석기 적응을 향상시킨다.
중국어 문장 레이블링 작업은 정확한 단어 경계 구분에 크게 의존하며, 현재 사전 학습된 언어 모델은 이러한 경계 정보를 모델링하는 데 한계가 있다. 본 연구는 고품질 감독 경계 정보를 활용하여 기존 경계 인식 언어 모델을 개선하였으며, 이를 통해 중국어 자연어 이해 작업에서 우수한 성능을 달성하였다.
COIG-CQIA는 중국어 사용자와의 상호작용을 잘 반영하는 고품질 중국어 지침 미세 조정 데이터셋을 제공한다.
최신 언어 모델은 중국어 우화적 속담을 생성할 수 있지만, 여전히 인간의 창의성에는 미치지 못한다.
본 논문은 중국어 오픈 정보 추출을 위한 혁신적인 모델 APRCOIE를 제안한다. APRCOIE는 자동으로 추출 패턴을 생성하여 다양한 중국어 문법 현상을 효과적으로 다룰 수 있다.
중국어 텍스트에서 자동으로 생성된 패턴을 활용하여 효과적으로 사실 트리플을 추출하는 APRCOIE 모델을 제안한다.