Effektives Feintuning von Großsprachmodellen für Agenten: Datendesign und Methoden
Durch sorgfältige Zerlegung und Neugestaltung des Trainingscorpus ermöglicht Agent-FLAN es Llama2-7B, frühere Arbeiten um 3,5% in verschiedenen Agentenbewertungsdatensätzen zu übertreffen. Mit umfassend konstruierten negativen Stichproben lindert Agent-FLAN die Halluzinationsprobleme erheblich.