核心概念
本文提出了一種名為 MAPLE 的新型行動應用程式預測模型,該模型利用大型語言模型 (LLM) 和已安裝應用程式的相似性來預測應用程式使用情況,有效解決了上下文數據異質性和冷啟動問題。
摘要
論文資訊
Khaokaew, Y., Xue, H., & Salim, F. D. (2024). MAPLE: Mobile App Prediction Leveraging Large Language Model Embeddings. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 8(1), 10. https://doi.org/10.1145/3643514
研究目標
本研究旨在探討如何利用大型語言模型 (LLM) 和已安裝應用程式的相似性來預測行動應用程式的使用情況。
方法
- 本文提出了一個名為 MAPLE 的新型預測模型,該模型利用 LLM 處理上下文數據,並利用已安裝應用程式的相似性來解決冷啟動問題。
- MAPLE 模型採用兩階段訓練方法:首先預測應用程式類別,然後預測特定應用程式。
- 研究人員使用兩個真實世界的數據集(Tsinghua App Usage 和 LSApp)評估了 MAPLE 模型的性能,並與其他基準模型進行了比較。
主要發現
- MAPLE 模型在標準和冷啟動情境下均優於現有模型,證明了其在預測應用程式使用方面的有效性。
- 實驗結果表明,利用 LLM 處理上下文數據和利用已安裝應用程式的相似性可以顯著提高預測準確性。
主要結論
- MAPLE 模型為行動應用程式使用預測提供了一種新穎、有效且實用的方法。
- LLM 和已安裝應用程式相似性的結合為解決上下文數據異質性和冷啟動問題提供了有希望的方向。
研究意義
本研究對行動應用程式使用預測領域做出了貢獻,開發了一種能夠更準確地預測使用者行為的模型,這對於個性化應用程式推薦、使用者行為分析和行動資源管理具有重要意義。
局限性和未來研究方向
- 未來研究可以探討將其他類型的上下文數據(例如社交網路資訊、感測器數據)整合到 MAPLE 模型中。
- 研究人員還可以探索使用更先進的 LLM 架構來進一步提高預測準確性。
統計資料
清華應用程式使用數據集包含 871 位用戶在一週內(2016 年 4 月 19 日至 4 月 26 日)超過 230 萬條行動應用程式使用記錄。
LSApp 數據集包含來自 293 位用戶的約 600,000 條行動應用程式使用記錄,每位用戶平均持續時間為 15 天。
在標準設定中,每個用戶的數據按時間順序劃分:70% 用於訓練,10% 用於驗證,20% 用於測試。
在冷啟動設定中,將用戶分為兩個不同的組:90% 用於訓練,10% 的未見用戶用於測試。
引述
"現有模型難以應對上下文數據的異質性和用戶冷啟動問題。"
"我們的研究提出了一種名為行動應用程式預測利用大型語言模型嵌入 (MAPLE) 的新型預測模型,該模型採用大型語言模型 (LLM) 和已安裝應用程式的相似性來應對這些挑戰。"
"MAPLE 利用 LLM 的強大功能來處理上下文數據並有效地辨別其中的複雜關係。"
"此外,我們還探索了使用已安裝應用程式的相似性來解決冷啟動問題,即使是歷史數據有限的新用戶,也可以促進對用戶偏好和習慣的建模。"