Core Concepts
タスクに特化したモデルを生成する新しいアプローチ、T2M(Text-to-Model)アプローチの可能性を示す。
Abstract
タスクに特化したゼロショット分類器の構築に焦点を当てる。
テキスト記述のみを使用して画像、3Dポイントクラウド、およびシーンからのアクション認識に統一的なアプローチを実証。
固定された表現ではなく、問い合わせ時にタスクに適したモデルを生成する方法を提案。
ハイパーネットワークを使用してタスク依存型ゼロショット分類器をトレーニングし、強力な改善を実証。
Introduction
タスク依存性と言語豊かさが限界である既存の研究に対処。
共有空間ZSLや生成ベースZSL手法の制約と問題点。
Problem Formulation
T2M-HNは問い合わせ時に要求されたクラスにチューニングされた差別的モデルを生成する目的。
Experiments
画像、3Dポイントクラウド、およびアクション認識用のT2M-HNの柔軟性をテスト。
異なる形式のテキスト記述(単語、フレーズ、長文)で評価。
Quotes
"Unlike approaches that learn a fixed representation of the output classes, we generate at inference time a model tailored to a query classification task."
"Our results demonstrate strong improvements over previous approaches, showing that zero-shot learning can be applied with little training data."