Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
Robustheit von LLMs in der Mathematik
GSM-PLUS: Eine umfassende Benchmark zur Bewertung der Robustheit von LLMs als mathematische Problemlöser
LLMs zeigen unterschiedliche mathematische Denkfähigkeiten, aber ihre Leistungen sind nicht robust.
1