The author proposes MulCogBench, a dataset to evaluate language models using cognitive data. Results show significant similarities between language models and human cognitive data.
言語モデルと認知データの関係を評価するための多様な認知データセットMulCogBenchが提案されました。