toplogo
Sign In

CO-Fun: Ein deutscher Datensatz zu Unternehmensauslagerungen in Fondsprospekten für Named Entity Recognition und Relation Extraction


Core Concepts
Ein Datensatz mit annotierten Sätzen aus deutschen Fondsprospekten, der für die Erkennung von Entitäten (Auslagerung, Unternehmen, Ort, Software) und die Extraktion von Beziehungen (Auslagerung-Unternehmen, Unternehmen-Ort) verwendet werden kann.
Abstract
Der Datensatz CO-Fun wurde aus 1.054 öffentlich zugänglichen deutschen Fondsprospekten erstellt. Insgesamt wurden 948 Sätze von drei Experten annotiert, wobei 5.969 Entitäten und 4.102 Beziehungen erfasst wurden. Die Entitäten umfassen vier Typen: Auslagerung, Unternehmen, Ort und Software. Die Beziehungen beschreiben Verbindungen zwischen Auslagerung und Unternehmen sowie zwischen Unternehmen und Ort. Für die Erkennung der Entitäten wurden zwei Modelle, Conditional Random Fields (CRF) und BERT, evaluiert. Das CRF-Modell erzielte auf dem Testdatensatz einen F1-Wert von 94%. Für die Extraktion der Beziehungen wurde ein RoBERTa-Modell verwendet, das 86,35% der Beziehungen im Testdatensatz korrekt klassifizierte. Der anonymisierte Datensatz, Annotationsrichtlinien und der Quellcode sind öffentlich verfügbar.
Stats
Die Gesellschaft hat Rechenzentrumsleistungen auf die Mercurtainment & CO KGaA ausgelagert. Die Gesellschaft hat IT-Dienstleistungen an die Mercurtainment & CO KGaA übertragen. Das Unternehmen hat Buchhaltungsaufgaben an die Mercurtainment & CO KGaA ausgelagert.
Quotes
"Die Gesellschaft hat Rechenzentrumsleistungen auf die Mercurtainment & CO KGaA ausgelagert." "Die Gesellschaft hat IT-Dienstleistungen an die Mercurtainment & CO KGaA übertragen." "Das Unternehmen hat Buchhaltungsaufgaben an die Mercurtainment & CO KGaA ausgelagert."

Key Insights Distilled From

by Neda... at arxiv.org 03-25-2024

https://arxiv.org/pdf/2403.15322.pdf
CO-Fun

Deeper Inquiries

Wie könnte man den Datensatz um weitere Informationen zu Unternehmensbeziehungen und Finanzkennzahlen erweitern?

Um den Datensatz um weitere Informationen zu Unternehmensbeziehungen und Finanzkennzahlen zu erweitern, könnten zusätzliche Annotationen hinzugefügt werden, die spezifische Beziehungen zwischen Unternehmen und Finanzkennzahlen identifizieren. Dies könnte beispielsweise die Verbindung von bestimmten Kennzahlen wie Umsatz, Gewinn oder Investitionen mit den beteiligten Unternehmen umfassen. Darüber hinaus könnten Informationen zu Verträgen, Partnerschaften oder anderen finanziellen Transaktionen zwischen den Unternehmen in den Datensatz aufgenommen werden. Durch die Erweiterung des Datensatzes um diese zusätzlichen Informationen könnte eine umfassendere Analyse der Unternehmensbeziehungen und Finanzdaten ermöglicht werden.

Welche Auswirkungen haben Auslagerungen auf die Cybersicherheit von Finanzinstituten?

Auslagerungen von Prozessen und Dienstleistungen an externe IT-Anbieter können erhebliche Auswirkungen auf die Cybersicherheit von Finanzinstituten haben. Durch die Auslagerung von sensiblen Daten und Geschäftsprozessen an Drittanbieter erhöht sich das Risiko von Datenverlust, Datenschutzverletzungen und Cyberangriffen. Finanzinstitute müssen sicherstellen, dass ihre externen Dienstleister strenge Sicherheitsstandards einhalten und angemessene Sicherheitsmaßnahmen implementieren, um die Vertraulichkeit, Integrität und Verfügbarkeit der Daten zu gewährleisten. Darüber hinaus müssen Finanzinstitute möglicherweise zusätzliche Ressourcen für die Überwachung, Bewertung und Sicherung der ausgelagerten Dienste bereitstellen, um die Cybersicherheit zu gewährleisten und potenzielle Risiken zu minimieren.

Inwiefern lassen sich die Erkenntnisse aus diesem Datensatz auf andere Branchen übertragen?

Die Erkenntnisse aus diesem Datensatz zu Unternehmensauslagerungen und Beziehungen in Finanzprospekten können auf andere Branchen übertragen werden, die ähnliche Beziehungen zwischen Unternehmen und Dienstleistern aufweisen. Branchen wie Technologie, Gesundheitswesen, Einzelhandel und Logistik könnten von der Anwendung ähnlicher NLP-Modelle zur Erkennung von Unternehmensbeziehungen und Auslagerungen profitieren. Die Methoden zur benannten Entitätenerkennung und Beziehungsextraktion, die in diesem Datensatz angewendet wurden, könnten auf andere Branchen angewendet werden, um Einblicke in Geschäftsbeziehungen, Partnerschaften und ausgelagerte Dienstleistungen zu gewinnen. Durch die Anpassung der Modelle an die spezifischen Anforderungen und Begrifflichkeiten anderer Branchen könnten ähnliche Analysen und Erkenntnisse gewonnen werden.
0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star