Core Concepts
승차공유 플랫폼 간 알고리즘 담합은 시장 특성에 따라 경쟁 또는 담합 균형으로 이어질 수 있다.
Abstract
이 연구는 승차공유 시장에서 현대적인 강화학습 알고리즘인 PPO(Proximal Policy Optimization)의 잠재적 담합 행태를 조사한다. 기존 연구들은 단순한 강화학습 알고리즘과 기본적인 시장 모델을 사용했지만, 이 연구는 복잡한 승차공유 시장 모델에서 PPO의 담합 경향을 탐구한다.
구체적으로 연구팀은 수학적 프로그램 네트워크(MPN) 기반 승차공유 모델을 시간 의존적 다중 기점-목적지 설정으로 확장하고, PPO를 사용하여 반복적 독점 게임을 해결한다. 결과에 따르면 PPO는 시장 특성에 따라 경쟁 또는 담합 균형으로 수렴할 수 있다.
공급 시장의 반응성이 높은 경우, 플랫폼 간 치열한 경쟁으로 인해 이윤이 감소한다. 반면 공급 시장의 반응성이 낮은 경우, 알고리즘이 공급 측면에서 담합하여 초과 이윤을 얻는 것으로 나타났다. 이는 규제 당국이 시장 특성을 고려해야 함을 시사한다.
Stats
플랫폼 U의 수익은 시간에 따라 감소하여 경쟁 균형에 수렴한다.
플랫폼 L의 수익은 시간에 따라 증가하여 담합 균형에 수렴한다.
공급 시장의 반응성이 낮은 경우, 플랫폼들은 운전자 수수료를 최소 수준으로 유지하며 초과 이윤을 얻는다.
Quotes
"공급 시장의 반응성이 높은 경우, 플랫폼 간 치열한 경쟁으로 인해 이윤이 감소한다."
"공급 시장의 반응성이 낮은 경우, 알고리즘이 공급 측면에서 담합하여 초과 이윤을 얻는다."