이 논문은 문맥 배너 최적화를 위한 새로운 Feel-Good Thompson Sampling 알고리즘을 제안한다. 기존 UCB 기반 알고리즘과 달리, 제안된 알고리즘은 다음과 같은 특징을 가진다:
새로운 Feel-Good 탐험 항목을 도입하여 배너 간 비교에 특화되어 있다. 이를 통해 교차 항목을 제거하여 분석이 용이해졌다.
행동 선택 과정에서 두 배너가 독립적이므로, 계산 복잡도가 낮다. 특히 무한한 행동 공간에서도 효과적으로 작동한다.
이론적 분석을 통해 거의 최소-최대 최적의 후회 한계를 달성함을 보였다.
실험 결과, 제안된 알고리즘이 기존 알고리즘들에 비해 큰 폭으로 성능이 향상됨을 확인하였다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Xuheng Li,He... lúc arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06013.pdfYêu cầu sâu hơn