Core Concepts
近年、大規模言語モデルの安全性に対する懸念が高まり、研究者や実践者がモデルの安全性を評価・改善するための新しいデータセットを数多く公開してきた。しかし、これらのデータセットは目的や特徴が多様であり、利用者が適切なデータセットを見つけるのが難しい状況にある。
Abstract
本研究では、大規模言語モデルの安全性を評価・改善するためのオープンデータセットについて、体系的なレビューを行った。2018年6月から2024年2月までに公開された102のデータセットを特定し、目的、作成方法、フォーマットと規模、アクセスと利用ライセンス、公開先などの観点から分析した。
主な知見は以下の通り:
データセット作成は近年急速に増加しており、主に学術機関や非営利組織が主導している
特定の安全性評価に特化したデータセットや、合成データを使ったデータセットが増加傾向にある
英語以外の言語のデータセットが不足している
大規模言語モデルのリリース論文や主要ベンチマークでは、利用されるデータセットが限定的で標準化が不足している
本レビューの結果は、大規模言語モデルの安全性評価の標準化や、最新のデータセット活用による評価の改善に役立つと考えられる。
Stats
2023年には、これまでで最も多い47件のデータセットが公開された。
86.3%のデータセットが英語のみで構成されている。
39.2%のデータセットがMITライセンス、13.7%がApache 2.0ライセンスを採用している。
Quotes
"近年、大規模言語モデルの安全性に対する懸念が高まり、研究者や実践者がモデルの安全性を評価・改善するための新しいデータセットを数多く公開してきた。"
"しかし、これらのデータセットは目的や特徴が多様であり、利用者が適切なデータセットを見つけるのが難しい状況にある。"
"86.3%のデータセットが英語のみで構成されている。"