Core Concepts
中国語名詞句における複数性と定冠詞マーカーの省略に焦点を当て、文脈から意味を予測する可能性を検証。
Abstract
この研究では、中国語名詞句の文脈から意味を予測する能力を探求しました。多くの表現が省略され、その意味が文脈から推測されることが示唆されました。コーパス分析や機械学習モデルのトレーニングを通じて、中国語話者は複数性と定冠詞マーカーを頻繁に省略する傾向があることが明らかになりました。さまざまなモデルを使用して、これらの要素の予測可能性を検証しました。結果は、BERT-wwmが最も優れたパフォーマンスを示したことや、同時に複数性と定冠詞を予測することでモデルのパフォーマンスが向上したことなどが挙げられます。
Stats
79158個の単数形、24528個の複数形、48471個の定冠詞あり、55215個の不定冠詞あり
Quotes
"Theoretical linguists have suggested that some languages (e.g., Chinese and Japanese) are “cooler” than other languages based on the observation that the intended meaning of phrases in these languages depends more on their contexts."
"The results suggest that Chinese speakers indeed drop plurality and definiteness markers very frequently."
"We report on the performance of these models and analyse their behaviours."