本研究では、大規模言語モデル(LLM)を用いて学術知識の構造化と分析を行う手法を提案している。具体的には以下の3つの取り組みを行っている:
認知知識グラフ(CKG)の概念の定義: 従来の知識グラフでは表現が難しい複雑な概念や文脈を捉えるため、グラフレットと呼ばれる再利用可能な認知パターンを持つCKGを提案している。
プロンプトへの文脈知識の注入: CKGから抽出した文脈知識をプロンプトに注入することで、LLMの性能を向上させている。特に、研究分野の予測タスクでは大幅な精度向上が確認された。
CKGを活用したLLMの微調整: LLMにCKGの知識を付与することで、ドメイン固有のタスクでの性能を高めている。特に、論文の貢献を記述する際の述語の推薦では、微調整によって大幅な性能向上が得られた。
これらの取り組みにより、LLMの限界を克服し、学術知識の構造化と分析を高精度に行うことができるようになった。この手法は、政策立案者、産業界、一般市民など、様々なステークホルダーにとって重要な学術知識の整理と活用に貢献できると期待される。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問