이 논문에서는 미오픽 광고주와 비미오픽 광고주의 차이를 고려하여 알고리즘을 설계했습니다.
미오픽 광고주: 미오픽 광고주는 각 라운드에서 현재 라운드의 유틸리티를 최대화하려고 합니다. 이 경우, 상대적으로 간단한 UCB 알고리즘을 사용하여 온라인 경매 메커니즘을 설계했습니다. 이 알고리즘은 각 광고주의 입찰가와 CTR을 고려하여 상위 입찰자를 선택하고 두 번째로 높은 예상 가치의 광고에 대한 가격을 정합니다. 이를 통해 O(√T)의 최악의 경우 후회를 달성했습니다.
비미오픽 광고주: 비미오픽 광고주는 장기적인 유틸리티를 최대화하려고 합니다. 이 경우, 광고주는 앞선 라운드에서 전략적으로 입찰하여 메커니즘을 조작하려고 할 수 있습니다. 이에 대응하여 탐색-그 후-확정 알고리즘과 UCB를 결합한 온라인 경매 메커니즘을 설계했습니다. 이 알고리즘은 초기 탐색 라운드를 통해 가장 높은 eCPM을 가진 광고를 찾은 후, 나머지 라운드에서 UCB 추정치를 사용하여 경매를 운영합니다. 이를 통해 음수 후회를 달성했습니다.
0
목차
온라인 학습 알고리즘 개선: 광고 경매에서 CTR 예측
Improved Online Learning Algorithms for CTR Prediction in Ad Auctions