本論文では、言語処理(NLP)と言語学の関係について論じている。近年の大規模言語モデル(LLM)の発展により、言語処理がことばの文法や意味的一貫性を特別に設計したモジュールなしでも高度な流暢な文章を生成できるようになったことから、言語学の専門知識の将来的な役割が問われている。
しかし、著者らは、言語処理がなお以下の6つの側面において言語学の知見に依存していると主張する。
リソース: 言語の多様性、方言/話者の変異、ジャンルの違いなどを考慮した言語リソースの選択と作成には言語学の知識が不可欠。
評価: 言語タスクの基準評価や人間評価の設計、自動評価指標の検証には言語学の知識が重要。
低リソース環境: 少量のデータしか利用できない場合や、言語の記録が限られている場合に、言語学の知見が一般化性の向上に役立つ。
解釈可能性と説明可能性: 言語学の概念や用語を使うことで、複雑な言語処理モデルの内部動作を理解し、説明することができる。
言語研究: 構文解析、照応解析、テクスト蕩義推論などの言語学的タスクは、言語処理コミュニティの重要な研究対象となっている。
言語保存と言語学習: 危機言語の保存や言語学習支援アプリケーションの開発には、言語学者と機械学習専門家の協力が不可欠。
このように、言語処理は言語学の知見に多くを依存しており、両分野の連携が重要であると結論付けている。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询