이 논문은 온라인 소매 상황에서 발생하는 공동 광고 판매 문제를 다룹니다. 두 명의 구매자(예: 상인과 브랜드)가 협력하여 광고 슬롯을 구매하는 상황을 고려합니다. 메커니즘 설계자는 수익을 최대화하는 인센티브 호환 메커니즘을 설계해야 합니다.
저자들은 이 문제를 온라인 학습 관점에서 접근합니다. 각 라운드에서 새로운 구매자 쌍이 도착하고, 메커니즘 설계자는 지배전략 인센티브 호환(DSIC) 및 개별 합리성(IR) 메커니즘을 제안합니다. 구매자들은 자신의 가치를 진실하게 보고하며, 메커니즘 설계자는 이를 통해 수익을 얻습니다. 메커니즘 설계자의 목표는 최고의 고정 메커니즘 대비 후회를 최소화하는 것입니다.
저자들은 세 가지 환경을 고려합니다:
각 환경에 대해 저자들은 효율적인 학습 알고리즘을 제안하고, 이에 대한 상한과 하한을 분석합니다. 특히 확률적 환경에서는 ˜O(T^3/4) 후회 상한을, 부드러운 적대적 환경에서는 O(T^2/3) 후회 상한을 달성합니다. 반면 적대적 환경에서는 최고 메커니즘 수익의 절반 이상을 달성할 수 없음을 보입니다.
이 연구는 비배제적 메커니즘 설계 문제에 대한 온라인 학습 접근법을 제시하며, 다양한 환경에서의 학습 가능성과 한계를 보여줍니다.
Іншою мовою
із вихідного контенту
arxiv.org
Глибші Запити