核心概念
本文介紹了首個完全由大型語言模型協作生成的故事資料集 CollabStory,並探討了多個大型語言模型在故事創作中的合作能力以及作者分析的挑戰。
統計資料
CollabStory 資料集包含超過 32,000 篇故事。
故事由 1 到 5 個 LLM 共同創作。
研究團隊使用了五個開源的 LLM:Llama2、Olmo、Gemma、Mistral 和 Orca。
每个 LLM 根據指定的字數和先前 LLM 生成的內容,接續完成故事的一部分。
引述
"CollabStory is the first exclusively LLM-LLM or machine-machine collaborative story dataset, and demonstrates the tasks it enables."
"We find that LLMs are able to collectively generate creative stories at par with human-written stories via sequential prompting."
"Using this dataset, we demonstrate which multi-LLM authorship tasks are most challenging."