المفاهيم الأساسية
UD 트리뱅크에 문법 구문을 유형론적으로 주석하여 언어 간 비교와 분석을 가능하게 하는 것이 이 연구의 핵심 목적이다.
الملخص
이 연구는 Universal Dependencies(UD) 트리뱅크에 문법 구문을 주석하는 방법을 제안한다. UD 트리뱅크는 140개 이상의 언어에 대한 귀중한 자원이지만, 문법 구문을 전체적으로 표현하지 못한다는 한계가 있다. 이에 연구진은 (i) UD 주석에 문법 구문을 나타내는 "UCxn" 주석 계층을 추가하고, (ii) 유형론적 접근을 통해 언어 간 형태통사적 전략을 비교하는 것을 제안한다.
연구진은 5가지 문법 구문(의문문, 존재문, 조건문, 결과구문, NPN 구문)을 10개 언어에서 조사했다. 각 구문에 대해 형태통사적 패턴을 활용하여 UD 트리뱅크에서 해당 구문의 인스턴스를 찾아내는 쿼리를 작성했다. 이를 통해 언어 간 전략의 차이와 유사성을 관찰할 수 있었다. 또한 이 과정에서 문법 구문을 언어 일반적이고 언어 특정적으로 기술하고 식별하는 방법론에 대한 중요한 통찰을 얻었다.
الإحصائيات
영어 의문문에서 WH 대명사가 전치되는 경우가 후치되는 경우보다 압도적으로 많다(28:3).
코프트어 의문문에서는 WH 대명사의 전치와 후치 비율이 더 균형적이다(5:2).
스페인어와 포르투갈어에서는 존재 동사 haber/haver가 소유 표현에도 사용된다.
히브리어 존재문에서는 소유주가 여격 논항으로 실현된다.
اقتباسات
"UD 주석은 구문의 개별 구성 요소(예: 목적어 관계와 의문 대명사)는 표현하지만 더 큰 전체는 표현하지 않습니다: UD에는 '의문절' 레이블이 없습니다."
"문법 구문을 언어 일반적이고 언어 특정적으로 기술하고 식별하는 방법론에 대한 중요한 통찰을 얻었습니다."