核心概念
Crocodile 模型通過多嵌入架構、跨專家協方差損失和先驗信息元素級門控機制,解決了多領域推薦系統中學習領域特定特徵和充分學習參數之間的困境,從而在公共數據集和騰訊廣告平台的線上 A/B 測試中實現了最先進的性能。
摘要
書目信息
Zhutian Lin1, Junwei Pan2, Haibin Yu2, Xi Xiao1*, Ximei Wang2, Zhixiang Feng2, Shifeng Wen2, Shudong Huang2, Dapeng Liu2, Lei Xiao2. 2018. Crocodile: Cross Experts Covariance for Disentangled Learning in Multi-Domain Recommendation. In Proceedings of Make sure to enter the correct conference title from your rights confirmation emai (Conference acronym ’XX). ACM, New York, NY, USA, 10 pages. https://doi.org/XXXXXXX.XXXXXXX
研究目標
本研究旨在解決多領域推薦系統中存在的兩個挑戰:保留每個領域的獨特性和充分學習嵌入表示。
方法
研究提出了一種名為 Crocodile 的新型多嵌入架構,該架構包含以下組件:
- 多嵌入層:利用多組嵌入查找表來學習每個領域的獨特表示。
- 專家和塔:採用多層感知器 (MLP) 作為專家和塔,並使用門控機制來聚合來自每個專家的表示輸出。
- 跨專家協方差損失 (CovLoss):通過最小化不同專家之間維度的協方差來解耦表示,從而捕獲用戶在不同領域的多樣化興趣。
- 先驗信息元素級門控 (PEG) 機制:在專家和塔之間實現對應維度的權重控制,並利用先驗信息來提高門控效率。
主要發現
- 現有的單嵌入多領域推薦模型無法保留領域獨特性,而採用多嵌入(尤其是特定於領域的嵌入)的模型可以更好地保留領域獨特性。
- 具有特定於領域的嵌入的模型由於跨領域數據量的不平衡,會導致小領域的嵌入學習不足,表現為維度崩潰。
- Crocodile 模型通過多嵌入架構、跨專家協方差損失和先驗信息元素級門控機制,有效地緩解了嵌入崩潰,同時學習了多樣化的表示。
主要結論
Crocodile 模型成功地解決了學習領域特定特徵和充分學習參數之間的困境,並在公共數據集和線上 A/B 測試中取得了最先進的性能。
貢獻
- 發現了現有多領域學習方法在學習領域特定特徵和充分學習參數之間的困境。
- 提出了 Crocodile 方法,該方法採用了分離多嵌入範式和先驗信息元素級門控 (PEG) 機制。
- 在兩個公共數據集以及騰訊廣告平台的線上 A/B 測試中獲得的經驗證據表明,Crocodile 取得了最先進的性能,並解決了上述困境。
局限性和未來研究方向
- 本文僅探討了基於協方差損失的解耦方法,未來可以探索其他解耦方法的有效性。
- 未考慮用戶和物品在不同領域的冷啟動問題,未來可以研究如何將 Crocodile 模型應用於冷啟動場景。
統計資料
在 Kuairand1k 數據集中,Crocodile 在整體 AUC 和 gAUC 方面分別顯著優於表現第二好的方法 0.09% 和 0.19%。
在 AliCCP 數據集中,Crocodile 的 AUC 和 gAUC 分別比表現第二好的方法高出 0.138% 和 0.12%。
在最小的領域 S6 中,Crocodile 的 AUC 和 gAUC 分別比 ME-PLE 高出 0.68% 和 1.8%,比 SDEM 高出 0.37% 和 0.98%。
與沒有 CovLoss 的方法相比,使用 CovLoss 的方法在 Kuairand1k 數據集上的 AUC 和 gAUC 分別顯著提高了 0.07% 和 0.17%。
引述
"現有的單嵌入推薦模型在多領域學習中無法保留領域獨特性。當採用多嵌入(尤其是特定於領域的嵌入)時,模型可以更恰當地保留領域獨特性。"
"具有特定於領域的嵌入的模型由於跨領域數據量的不平衡,會導致小領域的嵌入學習不足,表現為維度崩潰。"