本論文は、低リソース共通感覚推論のための強化学習ベースのメタ転移学習フレームワーク「Meta-RTL」を提案している。
メタ学習では、複数のソースタスクから得られた知識をターゲットタスクに転移することで、ターゲットタスクの性能を向上させることができる。しかし、従来のメタ学習手法では、ソースタスクの重要度を動的に調整できないため、ターゲットタスクに適応した知識転移が困難であった。
Meta-RTLでは、強化学習を用いて各ソースタスクの重みを動的に推定する。具体的には、メタモデルと各ソースタスク固有のテンポラルメタモデルの損失の差を報酬として、LSTMベースのポリシーネットワークを学習する。これにより、ターゲットタスクに適応した重み付けでソースタスクの知識を転移できる。
実験では、3つの共通感覚推論ベンチマークデータセットを用いて評価を行った。その結果、Meta-RTLは強力なベースラインを大幅に上回る性能を示し、特に極端に低リソースな設定でも大きな改善を達成した。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문