Core Concepts
通信ネットワーク上の複数のエージェントが協力して、それぞれの個別の学習課題を効率的に解決する手法を提案する。
Abstract
本論文では、通信ネットワーク上の複数のエージェントが協力して多タスク オンライン学習を行う手法を提案している。
具体的には以下の通りである:
各エージェントは自身の学習課題を持っており、ネットワーク上の近隣のエージェントとのみ情報交換が可能
提案手法MT-CO2OLでは、各エージェントがローカルにMT-FTRLアルゴリズムを実行し、近隣エージェントの予測モデルを活用して予測を行う
MT-CO2OLの後悔regretは、近隣エージェントの課題の類似度と通信ネットワークの構造に依存して改善される
さらに、MT-CO2OLをプライバシー保護版のDPMT-CO2OLに拡張し、プライバシーコストが小さい条件を明らかにした
Stats
各エージェントiの課題の分散は σ2
i = 1/(2Ni(Ni-1)) Σ(j,j')∈Ni ||Ui: - Uj':|]^2
全エージェントの平均課題分散は ¯σ2 = (1/N) Σj σ2
j