Das Entity6K-Datensatz wurde entwickelt, um die Fähigkeiten von Modellen zur Erkennung von Realwelt-Entitäten in Bildern zu evaluieren. Der Datensatz enthält 5.700 einzigartige Entitäten aus 26 verschiedenen Kategorien, wobei jede Entität mit 5 manuell überprüften Bildern und Annotationen versehen ist.
Der Datensatz wurde sorgfältig zusammengestellt, um eine große Vielfalt an Entitäten, Umgebungen und Darstellungen abzudecken. Im Gegensatz zu bestehenden Datensätzen enthält Entity6K spezifische Entitätsnamen, Begrenzungsboxen und detaillierte Bildunterschriften, die den Kontext und die Merkmale der Entitäten beschreiben.
Um die Leistungsfähigkeit verschiedener Modelle zu bewerten, wurden Benchmarks für Aufgaben wie Bildbeschriftung, Objekterkennung, Nullshot-Klassifizierung und dichte Beschriftung durchgeführt. Die Ergebnisse zeigen, dass keines der getesteten Modelle die Komplexität und Herausforderungen des Entity6K-Datensatzes vollständig meistern kann, was den Wert des Datensatzes für die Weiterentwicklung der Entitätserkennung in offenen Domänen unterstreicht.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询