Główne pojęcia
個人のウェブ検索履歴から、開放性、知的興味、知識、教育レベルを予測することができる。
Streszczenie
本研究では、214人の参加者のグーグル検索履歴から生成した個人テキストコーパス(IC)を用いて、開放性の予測モデルを構築した。
- 各ICから抽出した2500語の単語と、性格特性を表す単語ラベルとの類似度を特徴量として、ニューラルネットワークモデルを構築した。
- 訓練・検証データ(179人)とテストデータ(35人)に分けて評価したところ、テストデータでの開放性の分散の35%を説明できた。
- アンサンブルモデルでは、知的興味、人文知識、教育レベルの予測でもより安定した予測が得られた。
- 学習曲線分析の結果、約500人のサンプルサイズで一般化可能な予測が可能になると示唆された。
- 個人のウェブ検索履歴は、従来の心理検査に代わる、あるいは補完する新しい心理アセスメントとして活用できる可能性がある。
Statystyki
参加者の平均検索語数は500万語トークンであった。
開放性の分散の35%をテストデータで説明できた。
知的興味、人文知識、教育レベルの予測では、アンサンブルモデルが安定した予測を示した。
Cytaty
"you are what you read" (cf. Schaumlöffel et al., 2018)
"the most important individual differences in human transactions will come to be encoded as single terms in (…) language(s)" (quoted from Goldberg, 1993, p. 26)