Core Concepts
A-O disentanglement framework for CZSL using Class-specified Cascaded Network.
Abstract
人間の認知システムの特徴は、新しいカテゴリについて既知の概念を再構成することができる合成性であり、これに着想を得て、合成ゼロショット学習(CZSL)が提案されました。CZSLの中心は、統一された視覚的特徴から属性とオブジェクト情報を分離する方法です。多くの手法は、この問題に対処するために分離表現学習を使用しており、これらの手法はA-O間の文脈依存性を見落としています。そこで、Class-specified Cascaded Network(CSCNet)という新しいA-O分離フレームワークを提案します。このフレームワークでは、属性指定ガイダンスを使用してA2OおよびO2A依存関係を同時にモデル化します。さらに、パラメトリック分類器(ParamCls)を使用して視覚的セマンティック埋め込みの最適な一致スコアを学習します。実験と削減研究は、我々の手法の優越性を示しています。
Stats
5.7 in MIT-States and 3.4 in C-GQA represent 5.6% and 3.0% gains over previous state-of-the-art methods.
α is set to 4 on both datasets.
β is 0.1 on MIT-States and 0.2 on C-GQA.
Quotes
"Attribute and object (A-O) disentanglement is a fundamental and critical problem for Compositional Zero-shot Learning (CZSL)."
"Our framework achieves superior results than previous competitive methods."
"We propose a novel A-O disentangled framework termed Class-specified Cascaded Network (CSCNet)."