Automatisierte und präzise Annotation von NER-Datensätzen durch den Einsatz von LLMs
Dieser Artikel stellt einen neuartigen hybriden Annotationsansatz vor, der die Fähigkeiten von Large Language Models (LLMs) mit manuellen Annotationen kombiniert, um die Qualität von Datensätzen für Named Entity Recognition (NER) zu verbessern. Dieser Ansatz zielt darauf ab, Fehler in manuellen Annotationen wie Auslassungen zu beheben und gleichzeitig die Kosten zu senken. Darüber hinaus wird eine Labelmischungstechnik eingeführt, um das Problem der Klassenungleichgewichte bei LLM-basierten Annotationen anzugehen.