Automatische Erfassung der typischen Ereignisdauer für semi-überwachtes zeitliches Allgemeinwissen-Frage-Antwort-System
Wir schlagen einen abstimmungsbasierten semi-überwachten Ansatz vor, um die typische Dauer eines Ereignisses automatisch zu erfassen und als Pseudo-Beschriftungsdaten zu verwenden. Die menschliche Bewertung zeigt, dass unsere Pseudo-Beschriftungen eine überraschend hohe Genauigkeit und ausgewogene Abdeckung aufweisen. In der Aufgabe des zeitlichen Allgemeinwissen-Frage-Antwort-Systems zeigen die Versuchsergebnisse, dass wir mit nur Pseudo-Beispielen von 400 Ereignissen eine Leistung erreichen, die mit den bestehenden BERT-basierten schwach überwachten Ansätzen vergleichbar ist, die eine erhebliche Menge an Trainingsdaten erfordern.