FIT-RAG: Effiziente Retrieval-Augmented Generation für Großsprachmodelle durch Nutzung von Faktenwissen und Tokenreduktion
FIT-RAG nutzt sowohl Faktenwissen als auch die Präferenzen des Großsprachmodells, um relevante Dokumente effizient zu retrieven und die Anzahl der Eingabetokens zu reduzieren, um die Leistung von Retrieval-Augmented Generation für Großsprachmodelle zu verbessern.