核心概念
多くの関連するが異質な学習問題に同時に直面する意思決定者のために、ロバスト統計とLASSOを組み合わせた新しい多タスク学習推定量を提案する。この推定量は、特徴次元dに関して既存の手法よりも優れた性能を示し、特に「データ不足」の問題インスタンスにおいて顕著な改善が得られる。さらに、この多タスク学習推定量をコンテキストバンディットアルゴリズムに組み込むことで、同様の改善が得られる。
要約
本論文では、多くの関連するが異質な学習問題に同時に直面する意思決定者のための新しい多タスク学習手法を提案する。
まず、各問題インスタンスの未知パラメータを共通のグローバルパラメータと疎なインスタンス固有の項に分解する「疎な異質性」を仮定する。この構造を活用するため、ロバスト統計(trimmed mean)とLASSOを組み合わせた2段階の多タスク学習推定量RMEstimatorを提案する。
第1段階では、trimmed meanを用いて共通のパラメータを推定する。第2段階では、LASSOを用いてインスタンス固有のバイアス項を効率的に推定する。
この手法は、特徴次元dに関して既存の手法よりも優れた性能を示す。特に「データ不足」の問題インスタンスにおいて、推定誤差が指数的に改善される。
さらに、提案手法をコンテキストバンディットアルゴリズムに組み込むRMBanditを提案し、同様の改善が得られることを示す。
最後に、合成データと実データを用いた実験により、提案手法の有効性を確認する。
統計
各タスクjにおける標本共分散行列b
Σjの最小固有値λmin(b
Σj)は定数ψ以上である。
各タスクjにおける誤差項ϵjのサブガウス性パラメータはσjである。