本論文は、低リソース共通感覚推論のための強化学習ベースのメタ転移学習フレームワーク「Meta-RTL」を提案している。
メタ学習では、複数のソースタスクから得られた知識をターゲットタスクに転移することで、ターゲットタスクの性能を向上させることができる。しかし、従来のメタ学習手法では、ソースタスクの重要度を動的に調整できないため、ターゲットタスクに適応した知識転移が困難であった。
Meta-RTLでは、強化学習を用いて各ソースタスクの重みを動的に推定する。具体的には、メタモデルと各ソースタスク固有のテンポラルメタモデルの損失の差を報酬として、LSTMベースのポリシーネットワークを学習する。これにより、ターゲットタスクに適応した重み付けでソースタスクの知識を転移できる。
実験では、3つの共通感覚推論ベンチマークデータセットを用いて評価を行った。その結果、Meta-RTLは強力なベースラインを大幅に上回る性能を示し、特に極端に低リソースな設定でも大きな改善を達成した。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Yu Fu, Jie H... pada arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19075.pdfPertanyaan yang Lebih Dalam