초기 슬라브어 분사절 구문(연계 분사와 여격 절대 구문)과 그 주요 유한 경쟁 구문(jegda-절)의 선택을 동기 부여하는 원리를 이해하는 것이 이 논문의 목적이다.
이 연구는 라틴 아메리카 및 카리브해 지역 언어에서 일반적인 시간 종속절('때' 절)의 표현 방식에 대한 체계적인 변이를 탐구한다. 병렬 말뭉치 데이터를 활용하여 어휘적 및 형태론적 수단을 모두 포착할 수 있는 확률적 의미지도를 생성하였다.
이 논문은 파니니의 음성 체계와 유한 상태 기계를 활용하여 언어 간 단어 관계를 분석하고, 이를 바탕으로 언어 발전의 생태계 모델을 제안한다.
마그레브 지역의 풍부한 언어적 유산을 보존하고 활용하기 위해 TEI 표준을 적용하는 방안을 모색한다.
언어 간 유전적 관계를 검증하기 위해 정렬된 단어 목록의 불변 문자 사이트 비율을 이용한 우도비 검정 방법을 제안한다.
언어 방언의 특성을 고려한 자연어 처리 기술 개발이 필요하다. 방언은 언어의 문법과 어휘에 차이가 있어 기존 자연어 처리 기술의 성능 저하를 초래할 수 있다. 따라서 방언 인식, 감성 분석, 기계 번역 등 다양한 자연어 처리 과제에서 방언 특성을 반영한 접근이 필요하다.
이 연구는 벵골어 국제 음성 기호 전사를 위한 포괄적인 프레임워크를 제안하고, 150,000개의 문장 수준 데이터셋을 소개합니다.
영어와 독일어의 의회 토론 코퍼스를 분석한 결과, 두 언어 모두 시간이 지남에 따라 문법적 복잡성이 감소하고 의사소통 효율성이 증가하는 경향을 보인다. 이는 구문 의존 거리 최소화 원칙에 따른 것으로 해석된다.
언어 간 통사적 유사성을 부분 품사 n-그램 분포를 통해 정량화하고, 이를 바탕으로 언어 간 관계를 분석하였다. 또한 언어적 거리와 지리적 거리 간의 상관관계를 확인하였다.
마오리어를 모르는 뉴질랜드인들은 유창한 화자와 매우 유사한 방식으로 마오리어 단어를 분절할 수 있다. 이러한 능력은 통계적으로 반복되는 형태를 식별하고 추출하는 것에서 비롯된다고 가정되지만, 다양한 형태론적 과정을 거친 단어에 대해서도 이들의 분절이 성공적이라는 점에서 이 가정이 의문시된다.