核心概念
単語埋め込み空間には、性別、スタイルの形式性、物体の特性などを示す解釈可能な次元が含まれている。従来の種子語ベースの手法では十分に機能しない場合があるため、人間の評価を活用して解釈可能な次元を改善する。
要約
本研究では、単語埋め込み空間に含まれる解釈可能な次元を抽出し、評価する手法を提案している。
- 従来の種子語ベースの手法では、適切な種子語の選択が難しく、うまく機能しない場合がある。
- そこで、人間の評価を活用して解釈可能な次元を改善する手法を提案した。
- 物体の特性(サイズ、危険度など)や文体的特性(形式性、複雑性)について、種子語ベースの手法と提案手法を比較評価した。
- 提案手法は、特に種子語ベースの手法が機能しない場合に大きな性能向上を示した。
- 提案手法は、人間の評価を活用することで、予測値の尺度も人間の評価と同程度に保つことができた。
統計
物体の特性について、種子語ベースの手法では多くの予測値が人間の評価の範囲を大きく超えていた。
一方、提案手法(FIT+S)の予測値は、ほとんどすべてが人間の評価の範囲内に収まっていた。