核心概念
少数のトレーニングサンプルでも高精度な社会ユーザーの地理位置推定を実現するため、対照学習を活用したFewUserフレームワークを提案する。
要約
本研究では、少数サンプルでも高精度な社会ユーザーの地理位置推定を実現するFewUserフレームワークを提案している。
FewUserの主な特徴は以下の通り:
- ユーザー表現モジュールでは、事前学習言語モデルとユーザーエンコーダを活用し、ユーザープロファイルやツイートなどの多様な入力を効果的に処理・融合する。
- 地理的プロンプティングモジュールでは、ハードプロンプト、ソフトプロンプト、セミソフトプロンプトを導入し、言語モデルの知識と地理データの隔たりを埋める。
- 対照学習を通じて、ユーザーと地理位置の表現を最適化する。対照損失と照合損失を組み合わせ、ハードネガティブマイニング戦略を用いて学習プロセスを洗練する。
実験では、既存手法と比較して、TwiUデータセットで26.95%、FliUデータセットで41.62%の精度向上を達成した。さらに、ユーザー表現の設計、テキストバックボーン、地理的プロンプティングの影響を詳細に分析し、有益な知見を得た。
統計
少数のトレーニングサンプルでも、FewUserは既存手法と比べて大幅に高い精度を達成できる。
例えば、1サンプルのみの設定でTwiUデータセットで26.95%、FliUデータセットで41.62%の精度向上を実現した。
引用
"少数のトレーニングサンプルでも高精度な社会ユーザーの地理位置推定を実現するため、対照学習を活用したFewUserフレームワークを提案する。"
"FewUserは既存手法と比べて大幅に高い精度を達成できる。例えば、1サンプルのみの設定でTwiUデータセットで26.95%、FliUデータセットで41.62%の精度向上を実現した。"