本論文では、言語現象を捉えるための詳細な文法規則を自動的に抽出する新しい手法を提案する。
まず、文法規則の形式的定義を行い、その上で疎ロジスティック回帰モデルの正則化パスを利用して、規則の抽出と順位付けを行う。
これにより、先行研究では捉えられていなかった言語現象を表す規則を抽出することができる。
具体的には、スペイン語、フランス語、ウォロフ語のツリーバンクから、語順や一致に関する規則を抽出し、その特徴や統計的性質を分析する。
抽出された規則は、言語記述文法の自動生成や言語類型論研究などに活用できる。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Santiago Her... klo arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17534.pdfSyvällisempiä Kysymyksiä