Core Concepts
古代イタリア語からラテン語への言語変化プロセスを体系的に理解するために、PILA (Proto-Italic to Latin) データセットを紹介する。
Abstract
PILA は、古代イタリア語 (Proto-Italic) とラテン語 (Latin) の間の約3,000組の語形対を含むデータセットです。データの収集と整理の詳細な手順を説明しています。
PILA の価値を2つの側面から示しています。
伝統的な歴史言語学の課題に対するベースラインの結果を提示しています。
他の歴史言語学データセットとの互換性を検討し、PILA がそれらを強化する能力を実証しています。
PILA は以下の特徴を持ちます:
古代イタリア語の完全な再構成形式とラテン語の反射形式を含む初の dataset
単語の活用形も含むため、形態論の影響を考慮できる
音韻変化以外の変化 (類推変化など) を注釈で示している
Stats
*fragelis から fragilis への母音弱化
*takslos から ta:lus への子音クラスター簡略化
*a:zide:jo: から a:rdeo: への脱落
*pauros から parvus への転置