核心概念
本稿では、透明性と再現性の高いテキストスコアリングを実現するために、汎用的な埋め込みベースのレキシコンを用いる手法を提案する。
要約
汎用埋め込みベースレキシコンを用いた、透明性と再現性の高いテキストスコアリング
本稿は、テキスト分析における新たな手法として、汎用的な埋め込みベースのレキシコンを用いたテキストスコアリングを紹介する研究論文である。近年、テキスト分析ツールは高度化の一途をたどっており、高性能ながらも動作の不透明性が高く、計算コストの高い最先端モデルと、透明性と適用容易性を備えつつも性能が限定的な従来の手作業によるテキストスコアリングツールのどちらを選択するかが課題となっている。
本稿では、両者の利点を兼ね備えた代替案として、汎用的な(事前学習済み)単語埋め込みから、研究者の入力作業を最小限に抑えて作成されたレキシコンを提案する。FastTextとGloVe(6B)の単語ベクトル表現から生成された概念レキシコンを提示し、埋め込みベースのレキシコンが、透明性が高く、かつ高性能なテキスト測定ツールの必要性に応えるものであると主張する。
本研究は、従来のテキストスコアリング手法における、高性能モデルの不透明性と、手作業によるツールの性能限界という課題を克服するために、汎用的な埋め込みベースのレキシコンを用いた、透明性と再現性の高いテキストスコアリング手法を提案することを目的とする。