Die Studie stellt einen neuartigen Ansatz zur Konstruktion eines Funktionsmaterialien-Wissensgraphen (FMKG) vor, der auf der Nutzung großer Sprachmodelle (LLMs) basiert. Durch die Feinjustierung von LLMs für Aufgaben der Namensnennung, Beziehungsextraktion und Entitätsauflösung können aus einer Sammlung von 150.000 Forschungsabstracts strukturierte Informationen in Form von Tripeln extrahiert werden.
Der FMKG organisiert diese Informationen in neun verschiedene Etiketten wie Name, Formel, Akronym, Struktur/Phase, Eigenschaften, Beschreiber, Synthese, Charakterisierungsmethode, Anwendung und Domäne. Jede Entität und Beziehung ist mit der Digital Object Identifier (DOI) der Quellpublikation verknüpft, was die Rückverfolgbarkeit und Glaubwürdigkeit des Wissensgraphen erhöht.
Die Leistungsfähigkeit des Ansatzes wird durch Evaluierung der feinjustierten LLMs in Aufgaben der Namensnennung, Beziehungsextraktion und Entitätsauflösung nachgewiesen. Darüber hinaus zeigt eine Analyse des resultierenden FMKG, dass er wertvolle Einblicke in die Verwendung von Funktionsmaterialien in Bereichen wie Batterien, Katalysatoren und Solarzellen liefert.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Yanpeng Ye,J... às arxiv.org 04-05-2024
https://arxiv.org/pdf/2404.03080.pdfPerguntas Mais Profundas