核心概念
針對人類移動預測中普遍存在的長尾分佈問題,本文提出了一種名為 LoTNext 的通用框架,通過圖調整和損失調整策略來有效提升對長尾興趣點的預測準確率。
摘要
文獻摘要
本研究論文題為「馴服人類移動預測中的長尾效應」,探討了在人類移動預測,特別是興趣點(POI)預測中,如何解決長尾分佈帶來的挑戰。長尾分佈指的是少數熱門地點擁有大量訪問記錄,而大多數地點的訪問量稀少,這導致模型難以準確預測用戶對長尾興趣點的訪問。
研究方法
為了解決這個問題,作者們提出了 LoTNext 框架,該框架包含三個主要模組:
- 長尾圖調整模組 (LTGA): 該模組旨在減少用戶-興趣點交互圖中的噪聲和長尾節點。通過分析用戶和興趣點嵌入之間的交互,模型可以識別並保留重要的邊,同時過濾掉由長尾分佈引起的稀疏交互。
- 長尾損失調整模組 (LTLA): 為了平衡模型在訓練過程中對頭部和尾部數據的關注度,LTLA 模組採用了兩種策略:
- 邏輯分數調整: 根據標籤出現的頻率調整模型的輸出邏輯分數,降低高頻標籤的影響,提升低頻標籤的影響。
- 樣本權重調整: 根據樣本對整體預測的影響程度,自適應地調整每個樣本的權重,確保每個樣本都能夠根據其重要性程度參與到模型的學習過程中。
- 輔助預測任務: 為了進一步提升模型的預測準確率和魯棒性,LoTNext 還引入了時間預測作為輔助任務,幫助模型更好地捕捉用戶行為的時間動態變化。
實驗結果
作者在兩個公開的真實世界 LBSN 數據集(Gowalla 和 Foursquare)上對 LoTNext 進行了評估,並與其他 10 種最先進的方法進行了比較。實驗結果表明,LoTNext 在所有指標上均優於其他方法,特別是在預測長尾興趣點方面表現更為出色。
研究貢獻
本研究的主要貢獻在於:
- 提出了 LoTNext 框架,有效解決了人類移動預測中長尾數據分佈帶來的挑戰。
- 設計了 LTGA 和 LTLA 模組,分別用於圖調整和損失調整,提升了模型對長尾興趣點的預測準確率。
- 引入了時間預測作為輔助任務,進一步提升了模型的預測性能。
研究意義
本研究對於個性化推薦系統、城市規劃和交通管理等領域具有重要意義。通過準確預測用戶對長尾興趣點的訪問,可以為用戶提供更加個性化的服務,同時也有助於優化城市資源配置和交通流量分配。
統計資料
在 Gowalla 數據集中,將頻率低於 100 次的樣本定義為長尾樣本。
與 Graph-Flashback 相比,LoTNext 在預測長尾興趣點方面的傾向高出約 6%。
在 Gowalla 數據集中,定義長尾興趣點為訪問頻率低於 100 次的興趣點,約 98.38% 的興趣點可被視為長尾興趣點。
引述
"然而,現有研究往往忽視了空間訪問模式中固有的長尾分佈問題。"
"據我們所知,我們的工作是第一個針對長尾問題下的人類下一個興趣點預測提出通用框架的工作。"
"與 Graph-Flashback 相比,LoTNext 在 Acc@1 和 MRR 指標上始終表現優於 Graph-Flashback,無論是對於頭部樣本還是長尾樣本。"