核心概念
検索拡張生成 (RAG) は、情報検索を用いて生成モデルを外部知識で強化するための重要な要素として注目されていますが、その信頼性と洗練度を高めるためには、さらなる基礎的な探求が不可欠です。
書誌情報
Zihan Wang, Xuri Ge†, Joemon M. Jose, Haitao Yu, Weizhi Ma, Zhaochun Ren, and Xin Xin. 2024. R3AG: First Workshop on Refined and Reliable Retrieval Augmented Generation. In Proceedings of the 2024 Annual International ACM SIGIR Conference on Research and Development in Information Retrieval in the Asia Pacific Region (SIGIR-AP ’24), December 9–12, 2024, Tokyo, Japan. ACM, New York, NY, USA, 5 pages. https://doi.org/10.1145/3673791.3698435
研究目的
本ワークショップは、ダウンストリームAIタスクにおいて、より洗練され信頼性の高い検索拡張生成(R3AG)を実現するための基礎原則と実践的な実装について議論することを目的としています。
背景
検索拡張生成(RAG)は、情報検索(IR)を用いて、大規模言語モデル(LLM)からの生成応答を改善するための新しいパラダイムとして登場しました。RAGは、外部知識ベースから関連する知識を検索し、その知識に基づいて応答を生成することで、応答の質を大幅に向上させてきました。しかし、RAGの包括的な適用に伴い、より多くの問題や限界が明らかになってきており、現在のRAGフレームワークを改善するために、さらなる基礎的な探求が急務となっています。
主な議題
ユーザー意図理解: 特に長い対話コンテキストにおいて、ユーザーの検索意図をどのように理解するか。
クエリと知識のエンコーディング: 多様な知識とユーザーのクエリ間のずれをどのように解消し、効果的なクエリと知識のエンコーディングを行うか。
複雑な文書のためのRAG: 表や図形が埋め込まれた複雑な文書をどのように解析し、適切な知識チャンクを提供するか。
RAGのための信頼性の高い検索: ノイズや矛盾を含む情報の混入を防ぎ、RAGの堅牢性と信頼性を向上させるための検索戦略。
応答の評価と洗練: LLMが生成する応答の信頼性と正確性を向上させるための評価指標と、応答を洗練するための戦略。
マルチモーダルR3AG: テキストだけでなく、画像や音声などのマルチモーダルデータを扱うRAGへの拡張。
本ワークショップの意義
SIGIR-APは、IR関連の研究と応用に焦点を当てた、数多くの認められた研究成果を持つ主要な会議の一つです。R3AGワークショップをSIGIR-APで開催することで、複雑な情報検索の需要に応える興味深い研究を促進し、洗練され信頼性の高いRAGに関する深い研究と実践的な応用を奨励し、SIGIR-AP会議とワークショップの影響力を拡大できると考えています。