이 논문은 온라인 소매 상황에서 발생하는 공동 광고 판매 문제를 다룹니다. 두 명의 구매자(예: 상인과 브랜드)가 협력하여 광고 슬롯을 구매하는 상황을 고려합니다. 메커니즘 설계자는 수익을 최대화하는 인센티브 호환 메커니즘을 설계해야 합니다.
저자들은 이 문제를 온라인 학습 관점에서 접근합니다. 각 라운드에서 새로운 구매자 쌍이 도착하고, 메커니즘 설계자는 지배전략 인센티브 호환(DSIC) 및 개별 합리성(IR) 메커니즘을 제안합니다. 구매자들은 자신의 가치를 진실하게 보고하며, 메커니즘 설계자는 이를 통해 수익을 얻습니다. 메커니즘 설계자의 목표는 최고의 고정 메커니즘 대비 후회를 최소화하는 것입니다.
저자들은 세 가지 환경을 고려합니다:
각 환경에 대해 저자들은 효율적인 학습 알고리즘을 제안하고, 이에 대한 상한과 하한을 분석합니다. 특히 확률적 환경에서는 ˜O(T^3/4) 후회 상한을, 부드러운 적대적 환경에서는 O(T^2/3) 후회 상한을 달성합니다. 반면 적대적 환경에서는 최고 메커니즘 수익의 절반 이상을 달성할 수 없음을 보입니다.
이 연구는 비배제적 메커니즘 설계 문제에 대한 온라인 학습 접근법을 제시하며, 다양한 환경에서의 학습 가능성과 한계를 보여줍니다.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Gaga... om arxiv.org 09-13-2024
https://arxiv.org/pdf/2409.07819.pdfDiepere vragen