本文研究了一个涉及两个学习代理的重复Stackelberg博弈问题,即供应商(领导者)和零售商(追随者)在新闻亭定价游戏中的动态定价。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Larkin Liu,Y... lúc arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00203.pdfYêu cầu sâu hơn