核心概念
本文提出了一個基於協作式過濾的個人化研究論文推薦系統。該系統利用作者關鍵詞、共同作者、引用文獻和共同引用等特徵計算用戶之間的相似度,並根據最相似的用戶推薦論文。實驗結果表明,該系統在精確度、召回率和F-測度等指標上都有出色的表現。
摘要
本文提出了一個基於協作式過濾的個人化研究論文推薦系統。該系統主要包括以下步驟:
-
數據預處理:將數據集分為訓練集和測試集。
-
相似度計算:計算用戶之間的關鍵詞相似度、共同作者相似度、引用文獻相似度和共同引用相似度。
-
最終相似度:將上述四種相似度加權平均得到最終的用戶相似度。
-
論文推薦:根據目標用戶的最相似用戶推薦論文。推薦論文的條件是:被大多數相似用戶引用的論文。
-
性能評估:使用精確度、召回率和F-測度三個指標評估推薦系統的性能。
實驗結果表明,該系統在各項指標上都有出色的表現。隨著相似用戶數量的增加,精確度、召回率和F-測度都有顯著提升。這說明該系統能夠有效地為用戶推薦相關的研究論文。
統計資料
論文推薦系統的精確度隨著相似用戶數量的增加而提高,從100個相似用戶的0.779到1000個相似用戶的0.862。
召回率也隨著相似用戶數量的增加而提高,從100個相似用戶的0.777到1000個相似用戶的0.841。
F-測度也隨著相似用戶數量的增加而提高,表明該系統能夠在精確度和召回率之間達到良好的平衡。
引述
"協作式過濾是一種著名且最常用的推薦系統方法。這種方法使我們的模型更具可擴展性,因為它基於項目的過濾。"
"精確度可以被視為一種精確度的程度。這意味著被分類為正的數據點在現實中確實是正的。"
"召回率是一種完整性的程度,這意味著正數據點被分類為正。"
"F-測度被認為是召回率和精確度值的加權調和平均值。它可以被解釋為檢索集和相關集之間的Dice係數。"