이 논문은 메타 학습을 통해 여러 문맥 확률 밴딧 과제를 학습하는 문제를 다룬다. 저자들은 과제 분포가 저차원 아핀 부공간 주변에 집중된다고 가정하고, 온라인 주성분 분석을 통해 이 구조를 학습한다. 이를 활용하여 두 가지 의사결정 전략을 제안한다:
이 두 전략에 대해 이론적 분석을 수행하여 저차원 구조 학습의 이점을 입증한다. 또한 시뮬레이션과 실제 데이터 실험을 통해 제안 방법의 성능 향상을 확인한다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問