Core Concepts
ノイズの多いラベルデータに対処するため、正例ラベルのみを使用し、負例ラベルを無視することで高精度な多ラベル分類を実現する。
Abstract
本論文は、多ラベル分類(MLC)における課題であるラベルノイズに取り組むため、正例ラベルと未ラベル(正例と負例が混在)のデータのみを使用する正例-未ラベル(PU)学習ベースの手法PU-MLCを提案している。
具体的には以下の工夫を行っている:
負例ラベルを完全に無視し、正例ラベルと未ラベルデータのみを使用することで、ラベルノイズの影響を低減する。
正例と未ラベルの不均衡を補正するため、適応的な再重み付け係数を導入する。
多ラベル分類の複雑さに対処するため、適応的な温度係数モジュールを提案し、確率分布の滑らかさを調整する。
局所的および大域的な特徴を捉えるためのLocal-Global Convolutionモジュールを導入する。
これらの工夫により、PU-MLCは少ない正例ラベルでも高精度な多ラベル分類を実現できることを、MS-COCOおよびPASCAL VOCデータセットでの実験結果から示している。
Stats
多ラベル分類タスクでは、負例ラベルが正例ラベルに比べて圧倒的に多い。
提案手法PU-MLCでは、正例ラベルのみを使用し、負例ラベルを完全に無視することで、ラベルノイズの影響を低減できる。
Quotes
"To counteract noisy labels, we directly discard negative labels, focusing on the abundance of negative labels and the origin of most noisy labels."
"PU-MLC employs positive-unlabeled learning, training the model with only positive labels and unlabeled data."