Core Concepts
Negative Seed Entities verbessern die Darstellung ultra-fein granularer semantischer Klassen.
Abstract
Entity Set Expansion (ESE) identifiziert neue Entitäten derselben semantischen Klasse wie Samenentitäten.
Traditionelle Methoden verwenden positive Samenentitäten, was bei ultra-fein granularen semantischen Klassen problematisch ist.
Negative Samenentitäten lösen die semantische Ambiguität und ermöglichen die Darstellung von "unerwünschten" Semantiken.
UltraWiki ist ein groß angelegter Datensatz für Ultra-ESE mit 50.973 Entitäten und 394.097 Sätzen.
RetExpan und GenExpan bewerten die Leistung von Sprachmodellen in Ultra-ESE.
Strategien wie kontrastives Lernen und Rückgewinnung verbessern die Modellverständnis ultra-fein granularer Entitäten.
Stats
Negative Seed Entities eliminieren die semantische Ambiguität.
UltraWiki umfasst 50.973 Entitäten und 394.097 Sätze.
RetExpan und GenExpan bewerten die Wirksamkeit von Sprachmodellen.
GPT-4 kann die Herausforderungen von Ultra-ESE nicht gut bewältigen.
Quotes
"Negative Samenentitäten eliminieren die semantische Ambiguität."
"UltraWiki umfasst 50.973 Entitäten und 394.097 Sätze."