核心概念
提案されたLLP-Benchは、Criteo CTR予測とCriteo Sponsored Search変換ログデータセットから作成された70のLLPデータセットを含む大規模なタブラーデータセットであり、多様性が豊富である。
摘要
この論文では、LLP-Benchが提供する70のLLPデータセットについて詳細に分析しました。さまざまなメトリクスに基づいてデータセットを分類し、各ベンチマーク手法のパフォーマンスを説明しました。また、異常値の分析や特定のデータセットのパフォーマンスに関する詳細な説明も提供しています。
統計資料
70個のLLPデータセットが提案された。
Criteo CTR予測とCriteo Sponsored Search変換ログから作成された。
4つのメトリクスが使用されている:MeanBagSize, LabelPropStdev, InterIntraRatio, Bag Separation.
データセットはタブラー形式であり、多様性が豊富である。