toplogo
Sign In

個人のテキストコーパスから開放性、興味、知識、教育レベルを予測する


Core Concepts
個人のウェブ検索履歴から、開放性、知的興味、知識、教育レベルを予測することができる。
Abstract
本研究では、214人の参加者のグーグル検索履歴から生成した個人テキストコーパス(IC)を用いて、開放性の予測モデルを構築した。 各ICから抽出した2500語の単語と、性格特性を表す単語ラベルとの類似度を特徴量として、ニューラルネットワークモデルを構築した。 訓練・検証データ(179人)とテストデータ(35人)に分けて評価したところ、テストデータでの開放性の分散の35%を説明できた。 アンサンブルモデルでは、知的興味、人文知識、教育レベルの予測でもより安定した予測が得られた。 学習曲線分析の結果、約500人のサンプルサイズで一般化可能な予測が可能になると示唆された。 個人のウェブ検索履歴は、従来の心理検査に代わる、あるいは補完する新しい心理アセスメントとして活用できる可能性がある。
Stats
参加者の平均検索語数は500万語トークンであった。 開放性の分散の35%をテストデータで説明できた。 知的興味、人文知識、教育レベルの予測では、アンサンブルモデルが安定した予測を示した。
Quotes
"you are what you read" (cf. Schaumlöffel et al., 2018) "the most important individual differences in human transactions will come to be encoded as single terms in (…) language(s)" (quoted from Goldberg, 1993, p. 26)

Deeper Inquiries

個人のウェブ検索履歴から、他の性格特性や認知能力をどのように予測できるか。

この研究では、個人のGoogle検索履歴を使用して、個人のテキストコーパス(ICs)を生成しました。ICsは、個々の参加者の読書素材の意味構造を定義するために使用されました。ICとラベル単語の類似性を計算し、これらの類似性を予測機能として使用しました。ニューラルモデルを使用して、Big Five調査からの開放性を予測しました。結果として、選択されたニューラルモデルは、テストサンプルで開放性の35%の分散を説明しました。このアプローチは、個人の人間経験のサンプルを反映しており、開放性を含む他の性格特性や認知能力を予測するための有効な手法であることが示されました。
0