Core Concepts
提案された階層的テキスト分類のアドバーサリートレーニングフレームワーク(HiAdv)は、複雑な階層構造に対処する能力があり、既存のHTCモデルを補助します。
Abstract
この記事では、階層的テキスト分類(HTC)における局所階層の組み込みを支援するHiAdvフレームワークが提案されています。HiAdvは、複雑な階層構造に対処し、弱いモデルでも十分に学習できない場合に改善をもたらすことが示されています。実験では、HiAdvが複雑な階層からより多く学び取ることができることが示されました。また、局所階層は不足しているトレーニングインスタンスを持つ希少クラスのパフォーマンスを通常のクラスよりも向上させることが確認されました。
Stats
WOSデータセット:141クラス、深さ2、平均(|yi|) 2.0
NYTデータセット:166クラス、深さ8、平均(|yi|) 7.6
RCV1-V2データセット:103クラス、深さ4、平均(|yi|) 3.24
Quotes
"Hierarchical text classification (HTC) is a challenging subtask of multi-label classification due to its complex taxonomic structure."
"Nearly all recent HTC works focus on how the labels are structured but ignore the sub-structure of ground-truth labels according to each input text which contains fruitful label co-occurrence information."
"Our framework can be applied to any HTC architecture that involves a text encoder and a graph encoder."