Die Studie präsentiert eine Methode zur Erstellung eines Datensatzes für die automatische Generierung von Rätselfragen für Bildungskreuzworträtsel. Ausgehend von Wikipedia-Seiten werden relevante Schlüsselwörter und zugehörige Kontexte extrahiert. Mithilfe von Großen Sprachmodellen werden dann passende Rätselfragen zu diesen Schlüsselwörtern und Kontexten generiert.
Der so entstandene Datensatz "clue-instruct" umfasst 44.075 Beispiele, die jeweils einen Kontext, ein Schlüsselwort und drei dazugehörige Rätselfragen enthalten. Die Qualität der generierten Fragen wurde sowohl automatisch als auch durch menschliche Bewertung evaluiert. Die Ergebnisse zeigen, dass die feintunig der Sprachmodelle auf den Datensatz die Qualität der Rätselfragen deutlich verbessert.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania