本論文では、多くの関連するが異質な学習問題に同時に直面する意思決定者のための新しい多タスク学習手法を提案する。
まず、各問題インスタンスの未知パラメータを共通のグローバルパラメータと疎なインスタンス固有の項に分解する「疎な異質性」を仮定する。この構造を活用するため、ロバスト統計(trimmed mean)とLASSOを組み合わせた2段階の多タスク学習推定量RMEstimatorを提案する。
第1段階では、trimmed meanを用いて共通のパラメータを推定する。第2段階では、LASSOを用いてインスタンス固有のバイアス項を効率的に推定する。
この手法は、特徴次元dに関して既存の手法よりも優れた性能を示す。特に「データ不足」の問題インスタンスにおいて、推定誤差が指数的に改善される。
さらに、提案手法をコンテキストバンディットアルゴリズムに組み込むRMBanditを提案し、同様の改善が得られることを示す。
最後に、合成データと実データを用いた実験により、提案手法の有効性を確認する。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問