ChatGLM-Math: Verbesserung der mathematischen Problemlösungsfähigkeiten von großen Sprachmodellen durch eine Selbstkritik-Pipeline
Eine neuartige Selbstkritik-Pipeline, die sowohl die mathematischen als auch die sprachlichen Fähigkeiten von großen Sprachmodellen durch selbstgeneriertes Feedback verbessert, ohne auf externe Aufsichtsmodelle oder manuelle Annotationen angewiesen zu sein.