Die Studie präsentiert eine Methode zur Erstellung eines Datensatzes für die automatische Generierung von Rätselfragen für Bildungskreuzworträtsel. Ausgehend von Wikipedia-Seiten werden relevante Schlüsselwörter und zugehörige Kontexte extrahiert. Mithilfe von Großen Sprachmodellen werden dann passende Rätselfragen zu diesen Schlüsselwörtern und Kontexten generiert.
Der so entstandene Datensatz "clue-instruct" umfasst 44.075 Beispiele, die jeweils einen Kontext, ein Schlüsselwort und drei dazugehörige Rätselfragen enthalten. Die Qualität der generierten Fragen wurde sowohl automatisch als auch durch menschliche Bewertung evaluiert. Die Ergebnisse zeigen, dass die feintunig der Sprachmodelle auf den Datensatz die Qualität der Rätselfragen deutlich verbessert.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Andrea Zugar... at arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06186.pdfDeeper Inquiries