本文介紹了一個大規模的公開多模態銀行數據集MBD。該數據集包含以下四種模態:
銀行交易數據:包含約950M筆交易事件,涵蓋了客戶的財務活動。
地理位置數據:包含約1B個客戶使用銀行應用程序時的地理位置事件。
技術支持對話數據:包含約500萬條客戶與技術支持人員的對話記錄。
銀行產品購買情況:包含客戶在2022年每月購買4種銀行產品的情況。
利用這個數據集,我們提出了兩個實際的業務任務:
營銷預測:預測客戶在下個月是否會購買某些銀行產品。
客戶匹配:將不同模態的數據匹配到同一個客戶。
我們實施了多種基線方法,包括單模態和多模態的方法。實驗結果表明,多模態方法優於單模態方法,可以更好地解決這些任務。這為未來的多模態事件序列分析提供了新的視角和可能性。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Mollaev Dzha... lúc arxiv.org 09-27-2024
https://arxiv.org/pdf/2409.17587.pdfYêu cầu sâu hơn