核心概念
본 논문에서는 다양한 네트워크 조건과 트래픽 프로필에서 O-RAN 성능을 최적화하기 위해 다양한 DRL 에이전트 설계(예: 보상 설계, 동작 공간, 의사 결정 타임스케일)를 평가하고, DRL 에이전트의 세밀한 조정과 적절한 설계 선택이 네트워크 성능을 크게 향상시킬 수 있음을 보여줍니다.
要約
PandORA: 오픈 RAN을 위한 딥 강화 학습 에이전트의 자동 설계 및 포괄적 평가
Tsampazi, M., D’Oro, S., Polese, M., Bonati, L., Poitau, G., Healy, M., Alavirad, M., & Melodia, T. (2024). PandORA: Automated Design and Comprehensive Evaluation of Deep Reinforcement Learning Agents for Open RAN. IEEE Transactions on Mobile Computing.
본 연구는 다양한 트래픽 조건과 QoS 요구 사항을 처리할 수 있는 Open RAN 애플리케이션을 위한 딥 강화 학습(DRL) 에이전트를 설계하고 평가하는 것을 목표로 합니다. 구체적으로, 본 연구는 서로 다른 DRL 아키텍처, 보상 설계, 동작 공간 및 의사 결정 타임스케일이 네트워크 성능에 미치는 영향을 조사합니다.