イタリア語の言語モデルの数学的推論力と言語理解力を評価するための新しいベンチマークを開発した。これらのベンチマークは、イタリアの学校システムで使用されている実際のテストに基づいており、数学と言語理解の両方を評価することができる。