Core Concepts
組織が限られた不均衡データで学習パフォーマンスを向上させるための支援学習フレームワークを開発する。
Abstract
大規模な組織が機械学習を導入し、限られた不均衡データによって制約されている問題に対処するための支援学習フレームワークが提案されています。このフレームワークは、外部サービスプロバイダーから支援サービスを購入し、モデルパフォーマンスを向上させることを目的としています。通常、組織とコンサルティングエージェントの相互作用は厳格な規制とポリシーに従う必要があります。このフレームワークは、データ共有なしで外部エージェントから限られた支援サービスを購入してモデルパフォーマンスを大幅に向上させることを目指しています。
Stats
外部エージェントからの支援ラウンド数:10回
ローカルトレーニングイテレーション数:2000回
Quotes
"AssistDeepは、非常に不均衡かつ限られたデータを持つ場合でもLearner-SGDよりも優れたテストパフォーマンスを達成します。"
"AssistPGは複雑なRL問題に対処する際にLearner-PGよりも優れた品質のポリシー改善に効果的です。"