Alapfogalmak
大規模な検索空間と疎ロジスティック回帰を用いて、言語現象を捉えるための詳細な文法規則を自動的に抽出する。
Kivonat
本論文では、言語現象を捉えるための詳細な文法規則を自動的に抽出する新しい手法を提案する。
まず、文法規則の形式的定義を行い、その上で疎ロジスティック回帰モデルの正則化パスを利用して、規則の抽出と順位付けを行う。
これにより、先行研究では捉えられていなかった言語現象を表す規則を抽出することができる。
具体的には、スペイン語、フランス語、ウォロフ語のツリーバンクから、語順や一致に関する規則を抽出し、その特徴や統計的性質を分析する。
抽出された規則は、言語記述文法の自動生成や言語類型論研究などに活用できる。
Statisztikák
主語が動詞の後に位置する場合、主語の前に仮主語が現れる確率は約97%である。
スペイン語の形容詞-名詞の語順では、序数形容詞が名詞の前に来る確率は約98%である。
ウォロフ語の目的語は、有限動詞の前に位置する確率が約63%である。
フランス語では、名詞と冠詞の間で数の一致が見られる確率は約85%である。
Idézetek
"文法は、話者が言語を使う際に従わなければならない制約の集まりである。"
"文法規則は、ある文脈において特定の言語パターンを記述するものであり、様々な関心事に関連する。"
"文法規則は確率的な性質を持つ。例えば、英語では'主語は動詞の前に位置する'という単純な規則があるが、これは決定的ではなく、約93%の確率で成り立つ。"