Die Studie stellt einen neuartigen Ansatz zur Konstruktion eines Funktionsmaterialien-Wissensgraphen (FMKG) vor, der auf der Nutzung großer Sprachmodelle (LLMs) basiert. Durch die Feinjustierung von LLMs für Aufgaben der Namensnennung, Beziehungsextraktion und Entitätsauflösung können aus einer Sammlung von 150.000 Forschungsabstracts strukturierte Informationen in Form von Tripeln extrahiert werden.
Der FMKG organisiert diese Informationen in neun verschiedene Etiketten wie Name, Formel, Akronym, Struktur/Phase, Eigenschaften, Beschreiber, Synthese, Charakterisierungsmethode, Anwendung und Domäne. Jede Entität und Beziehung ist mit der Digital Object Identifier (DOI) der Quellpublikation verknüpft, was die Rückverfolgbarkeit und Glaubwürdigkeit des Wissensgraphen erhöht.
Die Leistungsfähigkeit des Ansatzes wird durch Evaluierung der feinjustierten LLMs in Aufgaben der Namensnennung, Beziehungsextraktion und Entitätsauflösung nachgewiesen. Darüber hinaus zeigt eine Analyse des resultierenden FMKG, dass er wertvolle Einblicke in die Verwendung von Funktionsmaterialien in Bereichen wie Batterien, Katalysatoren und Solarzellen liefert.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania