核心概念
本稿では、オフライン強化学習において、学習済みポリシーに個々の専門家の行動に関する情報を残さない、専門家レベルのプライバシー保護を実現する新しい手法を提案する。
要約
オフライン強化学習における専門家レベルのプライバシー保護:論文要約
Sharma, N., Vinod, V., Thakurta, A., Agarwal, A., Balle, B., Dann, C., & Raghuveer, A. (2024). Preserving Expert-Level Privacy in Offline Reinforcement Learning. arXiv preprint arXiv:2411.13598v1.
本研究は、医療や広告など、プライバシーに配慮が必要な分野において、オフライン強化学習を用いて専門家の行動データから効果的なポリシーを学習する際、個々の専門家のプライバシーを保護する手法を提案することを目的とする。