KnowCoder ist ein Modell für die universelle Informationsextraktion (UIE), das eine Code-basierte Schemarepräsentationsmethode und einen zweiphasigen Lernrahmen verwendet.
In der ersten Phase wird KnowCoder darauf trainiert, die in den Schemas definierten Konzepte zu verstehen. Dazu wird es auf einer großen Menge automatisch generierter Daten trainiert, die sowohl die Klassendefinitionen als auch Beispielinstanzen der Konzepte enthalten. Dieser Schritt verbessert die Fähigkeit von KnowCoder, die verschiedenen Konzepte zu verstehen.
In der zweiten Phase wird KnowCoder darauf trainiert, den spezifischen Schemas zu folgen und die entsprechenden strukturierten Informationen zu extrahieren. Dazu wird es auf einer großen Menge automatisch annotierter Daten feinabgestimmt, die Anweisungen, Eingabetexte und Extraktionsergebnisse enthalten. Dieser Schritt verbessert die Fähigkeit von KnowCoder, die Schemas zu befolgen und die entsprechenden Informationen zu extrahieren.
Basierend auf dieser zweiphasigen Lernmethode und der Code-basierten Schemarepräsentation erzielt KnowCoder bemerkenswerte Leistungen bei verschiedenen Informationsextraktionsaufgaben unter verschiedenen Evaluationseinstellungen, einschließlich Zero-Shot, Low-Resource und überwachter Einstellungen.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Zixuan Li,Yu... at arxiv.org 03-14-2024
https://arxiv.org/pdf/2403.07969.pdfDeeper Inquiries