Conceitos Básicos
WordNetの細粒度な語義を、英語学習用辞書との意味マッチングに基づいて粗粒度化し、新しい語義インベントリを構築する。
Resumo
本研究では、WordNetの細粒度な語義を、ケンブリッジ英語辞書との意味的マッチングに基づいて粗粒度化し、新しい語義インベントリを構築した。
具体的な手順は以下の通り:
- 英語学習で一般的に使用される15,885単語を対象語として選定した。
- WordNetからこれらの単語の語義情報(品詞、語義キー、語義定義)を抽出した。
- ケンブリッジ英語辞書の語義定義とWordNetの語義定義を比較し、意味的に近い語義をグループ化した。この際、言語モデルChatGPTを用いて柔軟な意味マッチングを行った。
- 複数のWordNet語義が1つのケンブリッジ辞書の語義に対応する場合、それらを1つの粗粒度語義グループにまとめた。
- 構築した粗粒度語義インベントリには、CEFR(外国語能力指標)レベルも付与した。
提案手法の利点は以下の通り:
- 大規模リソースに依存せず、辞書の語義定義のみで構築可能
- 自動化された構築プロセスにより、容易な拡張・改善が可能
- 既存の粗粒度インベントリと比べ、より密接な意味関係の語義をグループ化できる
- CEFR レベルの付与により、言語学習への適用が期待できる
Estatísticas
対象とした単語数: 15,885
構築した粗粒度語義インベントリの規模:
CLD ベース: 3,222 語義グループ
CED ベース: 9,457 語義グループ
Citações
"WordNetの細粒度な語義は、自然言語処理タスクの性能を低下させる問題がある。"
"提案手法の粗粒度語義インベントリは、大規模リソースに依存せず、容易に拡張・改善が可能である。"
"提案インベントリはCEFRレベルも付与されているため、言語学習への適用が期待できる。"