短動画検索においてパーソナライゼーションを導入することで、ユーザーエンゲージメントを大幅に向上させることができる。
文書の特性が情報検索拡張生成(RAG)システムの性能に大きな影響を与えることが示された。構造化された教科書、簡潔な論文、複雑な小説では、それぞれ異なる検索戦略が必要であることが明らかになった。文書分割手法の比較評価では、再帰的文字分割手法がトークンベースの分割手法よりも文脈の整合性を保持することが優れていることが示された。また、質問応答ペアを生成する新しい評価手法を導入し、精度と関連性を評価するための重み付きスコアリング手法を提案した。
情報検索モデルにおいて、ある文書がランキングされない理由を説明し、その文書のランキングを改善するための単語を特定する。
MessIRveは、スペイン語話者の情報ニーズを反映した大規模なスペイン語情報検索データセットである。
Rs4rsは、推薦システム分野の主要な会議やジャーナルから最新の論文を意味的に検索できるウェブアプリケーションです。
情報検索システムの有効性の時間的な持続性を評価するための再現性の測定手法を提案する。
ユーザーが少ない労力で効率的に水質危機に関する情報検索クエリを開発できるようにする。
文書ランキングにおいて、テキストマッチング、ランキング特徴、グローバル情報を統合的に活用することで、従来のカスケード型システムを大幅に改善できる。
生成型情報検索システムは、従来の文書ランキングではなく、関連情報を統合した生成テキストを直接出力することで、ユーザの情報ニーズを満たすことができる。しかし、このような生成型検索の評価には、従来の情報検索の評価手法では適していない。本研究では、生成型アドホック情報検索の評価に関する理論的基盤を提案する。
生成型関連フィードバックと適応型再ランキングを組み合わせることで、情報検索の性能を向上させることができる。