RAAMove 코퍼스는 인공지능(AI) 및 공학(Engineering) 분야의 연구 논문 초록을 대상으로 구축되었다. 이 코퍼스는 두 단계에 걸쳐 구축되었다. 첫 번째 단계에서는 전문가 annotator들이 수작업으로 고품질의 데이터를 annotate했다. 두 번째 단계에서는 BERT 기반 모델을 활용하여 자동 annotation을 수행하고, 전문가의 수정을 통해 annotation 품질을 유지했다.
코퍼스에는 총 33,988개의 annotated 인스턴스가 포함되어 있다. 이 코퍼스는 이동 구조 분석, 영어 교육 및 작문, 이동/담화 관련 NLP 작업 등에 활용될 수 있는 중요한 자원이 될 것이다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Hongzheng Li... lúc arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.15872.pdfYêu cầu sâu hơn