Core Concepts
선형 왜곡 손실 최소화를 통한 탐색은 구조화된 확률 밴딧 문제에 대한 무작위 탐색 방법을 제시하며, 데이터 의존적 왜곡을 통해 성능을 향상시키는 것을 목표로 합니다.
Abstract
EVILL은 선형적으로 왜곡된 정규화된 음의 로그 우도 함수의 최소화를 통해 탐색을 수행합니다.
PHE와 EVILL은 무작위로 왜곡된 보상에 대한 훈련을 통해 탐색을 수행하는 방법을 제공합니다.
EVILL은 Thompson 샘플링 스타일 매개 변수 왜곡 방법의 성능을 이론적으로도 실제적으로도 매치할 수 있음을 보여줍니다.
PHE는 구조화되지 않은 일반화된 선형 밴딧에서 일관되지 못한 추정치와 선형 후회를 초래할 수 있지만, EVILL은 성능이 유지됩니다.
EVILL은 PHE와 동등한 성능을 제공하며, Thompson 샘플링과 유사한 보상 분포에 대한 보상을 제공합니다.
Stats
EVILL은 Thompson 샘플링 스타일 매개 변수 왜곡 방법의 성능을 이론적으로도 실제적으로도 매치할 수 있음을 보여줍니다.
Quotes
"EVILL은 Thompson 샘플링 스타일 매개 변수 왜곡 방법의 성능을 이론적으로도 실제적으로도 매치할 수 있음을 보여줍니다." - 논문