核心概念
本文提出了一個基於機器學習的預測模型,用於評估科學論文的可重複性,並探討了影響可重複性的關鍵因素,特別是語言特徵(如可讀性和詞彙多樣性)與論文在作者中心和外部代理框架中達到最高狀態之間的密切關聯。
摘要
書目資訊
Akella, A. P., Choudhury, S. R., Koop, D., & Alhoori, H. (2024). Navigating the Landscape of Reproducible Research: A Predictive Modeling Approach. In Proceedings of the 33rd ACM International Conference on Information and Knowledge Management (CIKM ’24), October 21–25, 2024, Boise, ID, USA. ACM, New York, NY, USA, 10 pages. https://doi.org/10.1145/3627673.3679831
研究目標
本研究旨在開發一個預測模型,利用論文的文本和元數據特徵來預測其可重複性。
方法
- 收集了 ACM 電子圖書館中獲得「結果可重複」標記的論文,以及同一場地和年份未獲得標記的論文。
- 建立了一個包含作者中心和外部代理框架的聯合譜系,用於評估可重複性。
- 從論文文本和元數據中提取了結構性、學術性、場地、人工製品、語言學和雜項特徵。
- 使用梯度提升、AdaBoost、隨機森林、決策樹、邏輯回歸和神經網絡等機器學習模型進行了實驗。
- 評估了模型在預測作者中心和外部代理框架標籤方面的有效性。
主要發現
- 基於樹的模型(如梯度提升、AdaBoost、隨機森林和決策樹)在原始特徵集上表現出強大的性能,準確率得分在 78% 到 83% 之間,宏觀平均 F1 分數在 66% 到 74% 之間。
- 利用文本嵌入的模型顯示出良好的結果,特別是使用 ADA-002 嵌入的 MLP 模型,其準確率得分為 85%,宏觀平均 F1 分數為 77%。
- 語言特徵(如可讀性和詞彙多樣性)強烈影響模型的預測結果,表明語言清晰度和概念解釋的完整性與人工製品的質量和論文的可重複性密切相關。
主要結論
- 機器學習模型可以有效區分具有不同級別人工製品可用性的論文,這是可重複性的關鍵方面。
- 語言特徵在預測可重複性方面起著至關重要的作用,這表明清晰的寫作和全面的概念解釋可以提高研究的可重複性。
意義
本研究為評估科學研究的可重複性提供了一種基於模型的方法,並強調了語言清晰度在促進科學交流和可重複性方面的意義。
局限性和未來研究
- 未來的研究可以探索其他特徵和模型,以進一步提高可重複性的預測準確性。
- 研究結果應在更大的、更多樣化的數據集上進行驗證,以評估其普遍性。
統計資料
1.76% 的文章在 PapersWithCode 上提到了數據集。
1.01% 的文章在 PapersWithCode 上引用了一種方法。
9.43% 的文章在 PapersWithCode 上鏈接了官方 GitHub 存儲庫。
41.03% 的文章在全文(不包括「參考文獻」部分)中提到了 GitHub 存儲庫。
16% 的文章在全文中引用了 Zenodo,指向與研究相關的工件。
32.49% 的文章在 ACM 電子圖書館中提供了補充信息,例如代碼、音頻或視頻文件。
50.1% 的文章提到了資金來源,其中美國國家科學基金會、工程和物理科學研究委員會和德國研究基金會是被引用最多的機構。
引述
"By acknowledging varying degrees of reproducibility, we can elevate trust across the board and help identify common factors that contribute to reproducible research."
"Our goal in this study is to provide empirical evidence to support the use of such models and to identify crucial aspects influencing a paper’s reproducibility assessment."
"Linguistic measures such as readability and lexical diversity strongly influence the predictive outcomes of the models."