本論文では、半教師あり階層的マルチラベル分類器:局所情報に基づく(SSHMC-BLI)を提案する。このメソッドは、滑らかさ仮定に基づいており、ラベル付きの近傍インスタンスのラベルパスを利用して、非ラベル付きインスタンスの擬似ラベルを生成する。ただし、非ラベル付きインスタンスがラベル付きの近傍と類似しているかどうかも考慮する。
提案手法は、任意の有向非循環グラフ(DAG)型階層と、複数のラベルパスに関連付けられたインスタンスに対応できる。
実験では、Gene Ontology データセットを用いて評価を行った。ラベル付きデータのみを使った教師あり分類器と比較して、提案手法は統計的に有意に優れた性能を示した。特に、ラベル付きデータが少ない場合に大きな性能向上が見られた。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Tiefere Fragen