この研究は、NewsBenchという新しいベンチマークフレームワークを紹介しています。このフレームワークは、Large Language Models(LLMs)の能力を評価し、中国のジャーナリズムにおけるライティング能力と安全性への適合性を検証するために開発されました。1,267のタスクが含まれており、5つの編集アプリケーション、7つの側面(安全性とジャーナリズムライティング)、24のニューストピック領域をカバーしています。11つのLLMが評価され、GPT-4とERNIE Botがトップパフォーマーであることが明らかになりました。しかし、ジャーナリズム倫理に関する相対的な欠陥も浮き彫りになりました。
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Miao Li,Ming... lúc arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.00862.pdfYêu cầu sâu hơn