Core Concepts
서로 다른 언어로 작성된 문단 간 정보 차이를 세부적으로 식별하고 분석하는 것이 핵심 목표이다.
Abstract
이 연구는 X-PARADE라는 교차 언어 문단 수준 정보 차이 및 추론 분석 데이터셋을 소개한다. 이 데이터셋은 서로 다른 언어로 작성된 문단 간 정보 차이를 세부적으로 식별하고 분석하는 것을 목표로 한다.
데이터셋 구축 과정에서는 Wikipedia 문서에서 충분히 유사한 교차 언어 문단 쌍을 추출하고, 전문 평가자들이 이를 세부적으로 주석하였다. 주석에는 정보가 동일한 경우, 추론 가능한 경우, 새로운 정보인 경우 등을 구분하였다.
이 데이터셋을 활용하여 다양한 접근법의 성능을 평가하였다. 기계 번역 기반 토큰 정렬, 텍스트 추론 모델의 국소화된 결정, 대규모 언어 모델의 프롬프팅 등의 방법을 시도하였다. 그 결과 이 과제에서는 추론 가능한 정보를 다루는 것이 가장 어려운 것으로 나타났으며, 현재의 기술로는 인간의 성능을 따라가지 못하는 것으로 확인되었다.
Stats
도시는 John C. Williams와 Peter Demens가 공동으로 설립했다.
Peter Demens는 1888년 철도를 이 도시까지 연장하는데 기여했다.
1892년 2월 29일 St. Petersburg가 정식으로 도시로 인정되었고, 당시 인구는 300명이었다.
Quotes
"quien hizo llegar el ferrocarril hasta la ciudad en 1888"
"se incorporó el 29 de febrero de 1892, en aquella época tenía una población de sólo 300 habitantes"