Download Linnk AI
•
Research Assistant
>
Sign In
insight
-
Robustheit von LLMs in der Mathematik
GSM-PLUS: Eine umfassende Benchmark zur Bewertung der Robustheit von LLMs als mathematische Problemlöser
LLMs zeigen unterschiedliche mathematische Denkfähigkeiten, aber ihre Leistungen sind nicht robust.
1