본 연구는 알려지지 않은 분산을 가진 두 팔 가우시안 밴딧에서 고정 예산 최선의 팔 식별 문제를 다룹니다. 저자는 Neyman 할당을 사용하는 추정된 분산 기반 전략인 NA-AIPW 전략을 제안하고, 이 전략이 작은 격차 체제에서 Kaufmann et al. (2016)이 제시한 하한과 일치하는 오분류 확률 상한을 가짐을 보입니다. 이는 분산이 알려지지 않은 경우에도 최적의 전략을 찾을 수 있음을 시사합니다.
베이지안 최적화의 성능을 평가하기 위해 기존의 후회 기반 지표들은 최적해와 쿼리 포인트 간의 기하학적 관계를 고려하지 않는다. 이를 보완하기 위해 정밀도, 재현율, 평균 차수, 평균 거리 등의 새로운 기하학적 지표를 제안하고, 추가 매개변수 없이 사용할 수 있는 무매개변수 형태의 지표를 개발하였다.
MMD 정규화 f-Divergence는 RKHS에서 정의된 특정 함수의 Moreau 포락 함수로 나타낼 수 있다. 이를 통해 MMD 정규화 f-Divergence의 다양한 성질을 증명할 수 있다.
MMD 정규화 f-Divergence는 RKHS에서 정의된 특정 함수의 Moreau 포락 함수로 나타낼 수 있다. 이를 통해 MMD 정규화 f-Divergence의 다양한 성질을 증명할 수 있다.