核心概念
本稿では、科学分野における大規模言語モデル(LLM)の安全性評価のための包括的なベンチマークであるSciSafeEvalを提案する。
要約
SciSafeEval: 科学タスクにおける大規模言語モデルの安全性評価のための包括的なベンチマーク
Li, T., Lu, J., Chu, C., Zeng, T., Zheng, Y., Li, M., Huang, H., Wu, B., Liu, Z., Ma, K., Yuan, X., Wang, X., Ding, K., Chen, H., & Zhang, Q. (2024). SciSafeEval: A Comprehensive Benchmark for Safety Alignment of Large Language Models in Scientific Tasks. arXiv preprint arXiv:2410.03769.
本研究は、科学分野におけるLLMの安全性評価の現状における課題を克服するために、包括的なベンチマークであるSciSafeEvalを開発することを目的とする。