本論文では、大規模テキストコーパスに対するクエリ指向型要約を実現するためのグラフベースのRAG (Retrieval-Augmented Generation)アプローチを提案している。
まず、LLMを使ってテキストコーパスからエンティティとその関係を抽出し、エンティティグラフを構築する。次に、コミュニティ検出アルゴリズムを用いてグラフを階層的にパーティショニングし、各コミュニティの要約を生成する。ユーザのクエリに対しては、各コミュニティの要約を並列に生成し、それらを最終的に要約することで、包括的で多様な回答を得ることができる。
提案手法は、従来のRAGやテキスト要約手法と比較して、包括性と多様性の面で優れた性能を示した。また、コミュニティ要約を活用することで、大規模コーパスに対する効率的な処理が可能となった。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor