本文提出了一種電子商務網頁推薦方案,結合語義網絡挖掘和BP神經網絡算法,解決了不同類型網頁排序的問題,並實現了一個智能元搜索引擎,幫助用戶準確獲得所需的電子商務網頁信息。
該方案包括以下5個模塊:
預處理和詞典實現模塊:對搜索引擎檢索的候選網頁進行預處理,去除不完整的輸入項,清理數據和詞幹,並建立網頁詞典。
內容優先級模塊:使用網絡內容挖掘技術對文檔進行分類和排序,提取網頁相關性,確定網頁優先級,去除和檢索與服務產品無關的電子商務網站頁面。
時間消耗優先級模塊:根據候選網頁的時間戳確定網頁優先級,給予用戶停留時間較長的網頁更高的優先級。
語義推薦模塊:使用最長公共子序列算法識別不同語義行為文件的用戶會話數據,確定本體類別,避免對用戶檢索查詢的錯誤解釋。
BP神經網絡模塊:將內容優先級、時間消耗優先級、電子商務用戶對候選網站的顯式/隱式反饋、推薦語義和輸入偏差量作為BP神經網絡的5個輸入特徵,對網頁優先級進行分類和識別。
實驗結果表明,該方案的準確率和召回率均優於現有方案,且計算效率更高,能夠更好地識別用戶所需的網頁,適用於電子商務網站的排序和推薦。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Wenchao Zhao... lúc arxiv.org 09-12-2024
https://arxiv.org/pdf/2409.07033.pdfYêu cầu sâu hơn