核心概念
Existing language models in molecular research lack factual accuracy, leading to the development of MoleculeQA for comprehensive evaluation.
统计
大規模言語モデルは分子研究で重要だが、しばしば誤った情報を生成する。
従来の評価メトリクスは分子理解の正確さを評価できない。
MoleculeQAは62KのQAペアを持つ新しいデータセットであり、分子理解の事実評価に焦点を当てている。