Core Concepts
UD木構造に構文注釈層を追加することで、言語間で意味を伝える文法構造を包括的に記述し、比較することができる。
Abstract
本論文は、Universal Dependencies (UD)の注釈に構文注釈層を追加する手法を提案している。UD注釈は個々の文法要素を記述するが、複数の要素が組み合わさって意味を表す文法構造(構文)を包括的に記述していない。そこで、著者らは「UCxn」と呼ぶ構文注釈層を提案し、言語間で共通の機能を持つ構文を同定し、その形式的特徴を記述することを目指している。
具体的には以下の5つの構文について検討している:
疑問文: 疑問詞の位置や語順の違いなど、言語間の多様な実現形式を記述している。
存在文: 存在を表す述語の種類や主語の扱いの違いを明らかにしている。
条件文: 従属節の形式や動詞の法性など、言語間の多様な実現形式を記述することの難しさを示している。
結果構文: 結果状態を表す構文が言語間で大きく異なり、その定義自体が曖昧であることを指摘している。
NPN構文: 名詞の反復と前置詞/格標識からなる構文について、その意味機能の共通性と形式の多様性を明らかにしている。
これらの検討を通して、UD注釈に構文注釈層を追加することの意義と課題を示している。構文の定義や同定には言語学的な専門知識が必要であり、UD注釈のみでは不十分な場合があることを指摘している。一方で、UD注釈の共通性を活かしつつ、構文の多様性を記述できる可能性も示唆している。
Stats
疑問文の例:
英語では、疑問詞を前置する語順が圧倒的に多い(28:3)が、その他の文成分では前置が79%程度にとどまる。
コプト語では、疑問詞の前置と後置の比率がより均等(5:2)で、語順変化が少ない。
存在文の例:
言語によって、存在を表す述語が専用の語彙(スウェーデン語のfinnas)や所有動詞(ポルトガル語のter)を使う。
主語の扱いも言語間で異なり、UD注釈では主語(nsubj)、目的語(obj)、主語以外の要素(expl)など、様々な分析がなされている。