核心概念
本論文は、ロマニア語による数学的推論ベンチマーク「RoMath」を提案する。RoMathは、ロマニア語の数学問題を網羅する3つのデータセット(RoMath-Baccalaureate、RoMath-Competitions、RoMath-Synthetic)から構成される。これにより、英語以外の言語における数学モデルの開発を促進し、多言語AIの発展に寄与することを目的とする。
要約
本論文は、ロマニア語による数学的推論ベンチマーク「RoMath」を提案している。RoMathは以下の3つのデータセットから構成される:
-
RoMath-Baccalaureate: ロマニアの高校卒業試験(バカロレア)の問題5,777問を収録。計算問題と証明問題が含まれる。
-
RoMath-Competitions: 数学コンペティションの問題1,133問を収録。難易度が高く、洞察力と問題解決力が必要とされる。
-
RoMath-Synthetic: 70,000問の人工生成問題を収録。主に代数問題で構成される。
RoMathの目的は、英語以外の言語における数学モデルの開発を促進し、多言語AIの発展に寄与することである。ロマニア語は低資源言語であり、特有の言語的特徴を持つため、英語中心のモデルの限界を示し、多様な言語リソースの必要性を強調する。
論文では、RoMathに対する複数のオープンソースの言語モデルのベンチマークを行い、単純な翻訳では性能が大幅に低下することを示した。また、解答の正解判定に使用するジャッジモデルの性能評価も行った。
統計
数学問題の最終解答を含む文: \boxed{6/4055}
関数 u を定義する式: u = (2 - 18/15) * 5
方程式 u * y + 8 = 0, -28 = 3 * r + 4 * y - 5 の解: r = -5
関数 f(x) = e^x - x の積分: \int_0^1 f(x) dx = (e - 3/2)
関数列 f_n(x) = (f_1 o f_n)(x) の方程式 f_1(x) + f_2(x) + f_3(x) - 3 = 0 の解: x = 1
複素数 u, v, z の関係: |u| = |v| = 1, |u + v| = √3 ⇒ u * v + u * v = 1
不等式 (2/5) * (6 - 5x)/(5x + 2) ≤ 25/4 の解: x ∈ (-∞, -2] ∪ (-2/5, ∞)
引用
"Matematica s-o fi scriind cu cifre dar poezia nu se scrie cu cuvinte."
Nichita Stanescu, "Matematica poetica"