Das Entity6K-Datensatz wurde entwickelt, um die Fähigkeiten von Modellen zur Erkennung von Realwelt-Entitäten in Bildern zu evaluieren. Der Datensatz enthält 5.700 einzigartige Entitäten aus 26 verschiedenen Kategorien, wobei jede Entität mit 5 manuell überprüften Bildern und Annotationen versehen ist.
Der Datensatz wurde sorgfältig zusammengestellt, um eine große Vielfalt an Entitäten, Umgebungen und Darstellungen abzudecken. Im Gegensatz zu bestehenden Datensätzen enthält Entity6K spezifische Entitätsnamen, Begrenzungsboxen und detaillierte Bildunterschriften, die den Kontext und die Merkmale der Entitäten beschreiben.
Um die Leistungsfähigkeit verschiedener Modelle zu bewerten, wurden Benchmarks für Aufgaben wie Bildbeschriftung, Objekterkennung, Nullshot-Klassifizierung und dichte Beschriftung durchgeführt. Die Ergebnisse zeigen, dass keines der getesteten Modelle die Komplexität und Herausforderungen des Entity6K-Datensatzes vollständig meistern kann, was den Wert des Datensatzes für die Weiterentwicklung der Entitätserkennung in offenen Domänen unterstreicht.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Jielin Qiu,W... at arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12339.pdfDeeper Inquiries