Kernekoncepter
Durch den Einsatz fortschrittlicher Verarbeitungstechniken natürlicher Sprache können Millionen von Entitäten extrahiert und zu Tripeln zusammengefügt werden, um einen multidisziplinären Wissensgraphen für Funktionsmaterialien zu erstellen, der unstrukturierte Informationen in neun verschiedene Etiketten unterteilt und nahtlos mit den Digital Object Identifiern der Quellpublikationen integriert.
Resumé
Die Studie stellt einen neuartigen Ansatz zur Konstruktion eines Funktionsmaterialien-Wissensgraphen (FMKG) vor, der auf der Nutzung großer Sprachmodelle (LLMs) basiert. Durch die Feinjustierung von LLMs für Aufgaben der Namensnennung, Beziehungsextraktion und Entitätsauflösung können aus einer Sammlung von 150.000 Forschungsabstracts strukturierte Informationen in Form von Tripeln extrahiert werden.
Der FMKG organisiert diese Informationen in neun verschiedene Etiketten wie Name, Formel, Akronym, Struktur/Phase, Eigenschaften, Beschreiber, Synthese, Charakterisierungsmethode, Anwendung und Domäne. Jede Entität und Beziehung ist mit der Digital Object Identifier (DOI) der Quellpublikation verknüpft, was die Rückverfolgbarkeit und Glaubwürdigkeit des Wissensgraphen erhöht.
Die Leistungsfähigkeit des Ansatzes wird durch Evaluierung der feinjustierten LLMs in Aufgaben der Namensnennung, Beziehungsextraktion und Entitätsauflösung nachgewiesen. Darüber hinaus zeigt eine Analyse des resultierenden FMKG, dass er wertvolle Einblicke in die Verwendung von Funktionsmaterialien in Bereichen wie Batterien, Katalysatoren und Solarzellen liefert.
Statistik
Die Konstruktion des FMKG basiert auf der Extraktion von 162.605 Knoten und 731.772 Kanten aus 150.000 Forschungsabstracts.
Citater
"Durch den Einsatz fortschrittlicher Verarbeitungstechniken natürlicher Sprache können Millionen von Entitäten extrahiert und zu Tripeln zusammengefügt werden, um einen multidisziplinären Wissensgraphen für Funktionsmaterialien zu erstellen."
"Jede Entität und Beziehung ist mit der Digital Object Identifier (DOI) der Quellpublikation verknüpft, was die Rückverfolgbarkeit und Glaubwürdigkeit des Wissensgraphen erhöht."