Konsep Inti
大規模言語モデルを活用して、オントロジーのクラスやプロパティのインスタンスを自動的に生成し、ドメイン固有の知識を効率的にオントロジーに取り入れる。
Abstrak
本論文は、大規模言語モデル(LLM)を活用してオントロジーを自動的にインスタンス化する手法「KGFiller」を提案している。
まず、部分的に初期化されたオントロジー、クエリテンプレート、そして事前学習済みのLLMオラクルを入力とする。
KGFillerは以下の4つのフェーズで構成される:
個体生成フェーズ: LLMオラクルに対して個体生成クエリを発行し、オントロジーのクラスにインスタンスを追加する。
関係生成フェーズ: LLMオラクルに対して関係生成クエリを発行し、オントロジーのプロパティ間の関係を追加する。
再配置フェーズ: 各個体を最も具体的なクラスに再割り当てする。
統合フェーズ: 文字列的に似ている個体を統合する。
この一連のプロセスにより、ドメイン固有の知識がオントロジーに自動的に取り入れられる。専門家はその結果を確認・修正することができる。
提案手法は、LLMをオラクルとして活用することで、特定のデータセットに依存せずにオントロジーを自動的にインスタンス化できるという特徴がある。また、既存のオントロジーに対しても適用可能で、段階的な拡張が可能である。
Statistik
オントロジーの自動インスタンス化には、手作業による方法と自動抽出による方法がある。手作業は時間がかかり、人的ミスや偏りが生じる可能性がある。一方、自動抽出は効率的だが、データの偏りや不完全さから品質が低下する可能性がある。
Kutipan
"オントロジーは、概念と概念間の関係を形式的に定義し、機械可読な形式で表現するものである。"
"大規模言語モデルは、膨大なWebデータを学習することで、様々なドメインの知識を蓄積している可能性がある。"