科学文献分析におけるLLMの能力を評価するためのSciAssessベンチマークは、GPT-4、GPT-3.5-turbo、およびGeminiなどの主要なLLMを評価し、その強みと改善すべき点を明らかにしています。