이 논문은 메타 학습을 통해 여러 문맥 확률 밴딧 과제를 학습하는 문제를 다룬다. 저자들은 과제 분포가 저차원 아핀 부공간 주변에 집중된다고 가정하고, 온라인 주성분 분석을 통해 이 구조를 학습한다. 이를 활용하여 두 가지 의사결정 전략을 제안한다:
이 두 전략에 대해 이론적 분석을 수행하여 저차원 구조 학습의 이점을 입증한다. 또한 시뮬레이션과 실제 데이터 실험을 통해 제안 방법의 성능 향상을 확인한다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Steven Bilaj... a las arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00688.pdfConsultas más profundas