本研究探討了大型語言模型(特別是ChatGPT)在引文內容分析中的應用性。實驗結果顯示,ChatGPT的標註結果在一致性方面優於人工標註,但在預測性能方面表現較差。因此,目前的大型語言模型無法完全取代人工標註在引文內容分析中的應用。
然而,大型語言模型的標註結果可作為參考資訊,在多個人工標註者的結果中歸納出最終的標註資料。此外,在難以準備足夠人工標註者的情況下,大型語言模型也可作為其中一個標註者使用。
總的來說,本研究為未來引文內容分析的發展提供了基本發現。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询