本論文では、正例と未ラベルデータからなるPU学習問題に対して、未ラベルサンプルに事前知識に基づいて偽ラベルを付与する「偽ラベルPU学習」を提案している。
まず、従来のPU学習では全ての未ラベルサンプルを等しく扱うが、実際には事前知識から一部の未ラベルサンプルがより正例らしいことがわかる場合がある。そこで本手法では、そのような事前知識を活用して未ラベルサンプルに偽ラベルを付与する。
次に、真のTPR、FPR、AUCが未知の状況下で、これらの指標の代替指標となるTPRSPU、FPRSPU、AUCSPUを定義する。これらの指標は、偽ラベルを活用することで、真の指標の最適化につながることを理論的に示す。
最後に、これらの代替指標を最適化する学習手法を提案し、公開データセットおよびTencent Gamesのチーター検知タスクでの実験結果を示す。実験結果より、提案手法が従来手法に比べて優れた性能を示すことが確認された。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Puning Zhao,... : arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.01990.pdfDaha Derin Sorular