Erstellung eines synthetischen Datensatzes und Feinabstimmung von Transformer-Modellen für Frage-Antwort-Systeme auf Serbisch
Durch die Verwendung einer angepassten Translate-Align-Retrieve-Methode wurde der größte serbische Frage-Antwort-Datensatz mit mehr als 87.000 Beispielen erstellt. Dieser Datensatz wurde verwendet, um mehrere vortrainierte Frage-Antwort-Modelle feinabzustimmen, wobei das BERTić-Modell auf der lateinischen Version des Datensatzes die besten Ergebnisse erzielte.