この研究は、NewsBenchという新しいベンチマークフレームワークを紹介しています。このフレームワークは、Large Language Models(LLMs)の能力を評価し、中国のジャーナリズムにおけるライティング能力と安全性への適合性を検証するために開発されました。1,267のタスクが含まれており、5つの編集アプリケーション、7つの側面(安全性とジャーナリズムライティング)、24のニューストピック領域をカバーしています。11つのLLMが評価され、GPT-4とERNIE Botがトップパフォーマーであることが明らかになりました。しかし、ジャーナリズム倫理に関する相対的な欠陥も浮き彫りになりました。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Miao Li,Ming... a las arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.00862.pdfConsultas más profundas