Evaluierung und Vermittlung von Informationsrückgewinnungsmodellen zum Befolgen von Anweisungen
Moderne große Sprachmodelle (LLMs) können lange und komplexe Anweisungen befolgen, die eine Vielzahl von Benutzeraufgaben ermöglichen. Allerdings verwenden fast alle Informationsrückgewinnungsmodelle (IR-Modelle) immer noch nur Abfragen als Eingabe, ohne Anweisungen. Wir stellen FOLLOWIR vor, einen Benchmark zur Bewertung der Anweisungsfolge sowie einen Trainingssatz, um IR-Modelle besser beim Befolgen von Anweisungen zu unterstützen.