이 연구는 큐잉 시스템에서 서비스 속도를 모르는 상태에서 에이전트를 서버에 효율적으로 할당하는 방법을 학습하는 새로운 큐잉 매칭 밴딧 프레임워크를 제안하고, 시스템 안정성과 후회를 최소화하는 UCB 및 TS 기반 알고리즘을 소개합니다.