Core Concepts
話者は引数を省略するかどうかを判断する際に共通の基準を持っており、その判断には様々な言語的要因が関係している。
Abstract
本研究では、日本語の大規模なバランスコーパスから2,000以上のデータポイントを収集し、話者が引数を省略すべきかどうかを判断する際の理由を調査した。その結果、話者の判断には全体的な共通性があり、関連する言語的要因の分布にも特徴が見られることが明らかになった。さらに、言語モデルを用いた引数省略判断モデルの性能を評価したところ、特定の言語的側面においてシステムの予測と人間の判断の間にギャップがあることが明らかになった。本研究で作成したリソースは、自然な引数省略判断に関する研究を促進することが期待される。
Stats
引数省略は全体の37%に及ぶ非常に頻繁な現象である。
主格(NOM)引数の省略率は50%以上と高い。
対格(ACC)と与格(DAT)引数の省略率はそれぞれ18%、24%である。
Quotes
話者は引数の省略に関して共通の判断基準を持っている。
引数省略の判断には様々な言語的要因が関係している。
言語モデルは特定の言語的側面における引数省略の判断において人間と大きな差がある。