Основные понятия
Der BabyLM-Wettbewerb zielt darauf ab, Forscher zu motivieren, ihre Bemühungen auf die Optimierung des Vortrainings unter Berücksichtigung von Datenbeschränkungen zu konzentrieren, die durch die menschliche Entwicklung inspiriert sind.
Аннотация
Der BabyLM-Wettbewerb wird 2024/2025 erneut ausgetragen. Die übergeordneten Ziele des Wettbewerbs bleiben die gleichen, aber einige der Wettbewerbsregeln werden sich ändern:
Es wird ein Paper-Track eingeführt, der es Teilnehmern ermöglicht, Beiträge einzureichen, die nicht auf direkten Wettbewerbseinreichungen basieren, wie z.B. neuartige, kognitionsbasierte Bewertungsmetriken oder eingehende Analysen bestimmter BabyLM-Modelle.
Die Teilnehmer können nun ihre eigenen Datensätze erstellen, solange sie innerhalb des 100M-Wort- oder 10M-Wort-Budgets bleiben. Es wird jedoch weiterhin Datensätze geben, die von den Organisatoren bereitgestellt werden.
Es wird ein neuer multimodaler Vision-Sprache-Track eingeführt, für den ein Korpus mit 50% reinen Textdaten und 50% Bild-Text-Daten bereitgestellt wird.
Die Teilnehmer können ihre Modelle auf verschiedene Weise trainieren, solange sie die Datenbeschränkungen einhalten. Alle Modelle müssen in der Lage sein, einer Textsequenz eine (Pseudo-)Wahrscheinlichkeit zuzuweisen und für Klassifizierungsaufgaben feinabgestimmt werden können.
Статистика
Die Teilnehmer müssen einen Datensatz-Datenblatt einreichen, wenn sie nicht die von den Organisatoren bereitgestellten Datensätze verwenden.
Цитаты
Keine relevanten Zitate identifiziert.