核心概念
大規模言語モデルの強力な生成能力を活用し、知識制約と対話的学習を組み合わせることで、知識グラフ補完の再ランキングを効果的に実現する。
摘要
本論文は、知識グラフ補完(KGC)のための新しい再ランキング手法KC-GenReを提案している。従来の再ランキング手法は主に非生成型の言語モデルを使用していたが、生成型の大規模言語モデル(LLM)を活用することで、より強力な性能が期待できる。しかし、LLMを直接適用すると、候補エンティティとの不一致、順序の誤り、候補の欠落などの新たな問題が生じる。
KC-GenReでは以下の3つの手法を提案することで、これらの問題に対処している:
- 候補エンティティの名称ではなく、識別子の順序を出力することで、不一致の問題を解決する。
- 第一段階のKGE手法の推論結果を活用した対話的学習手法を開発し、候補の識別と順位付けを強化する。
- 文脈知識を活用した制約付き生成手法を設計し、有効な候補ランキングを得る。
実験結果から、KC-GenReが4つのデータセットで最先端の性能を達成し、従来手法と比べて最大6.7%のMRR向上、7.7%のHits@1向上を示している。さらに、各提案手法の有効性が確認された。
統計資料
知識グラフ補完タスクでは、多くの事実が欠落しており、これが様々なアプリケーションの性能を阻害している。
大規模言語モデルは、情報抽出やダイアログシステムなどの分野で優れた性能を示しているが、知識グラフ補完では新たな課題に直面する。
従来の再ランキング手法は非生成型の言語モデルを使用しているが、生成型の大規模言語モデルを活用することで、より強力な性能が期待できる。
引述
"大規模言語モデル(LLMs)は、情報抽出やダイアログシステムなどの分野で優れた性能を示している。"
"従来の再ランキング手法は主に非生成型の言語モデルを使用しているが、生成型のLLMを活用することで、より強力な性能が期待できる。"