Tải xuống Linnk AI
•
Trợ lý nghiên cứu
>
Đăng nhập
thông tin chi tiết
-
Robustheit von LLMs in der Mathematik
GSM-PLUS: Eine umfassende Benchmark zur Bewertung der Robustheit von LLMs als mathematische Problemlöser
LLMs zeigen unterschiedliche mathematische Denkfähigkeiten, aber ihre Leistungen sind nicht robust.
1