Khái niệm cốt lõi
동적 환경에서 엣지 컴퓨팅 디바이스의 시간 변화하는 계산 능력을 고려하여 사용자 경험을 향상시키기 위한 딥 강화 학습 기반의 태스크 그래프 오프로딩 전략
Tóm tắt
이 논문은 모바일 엣지 컴퓨팅(MEC) 환경에서 태스크 그래프 오프로딩 문제를 다룹니다.
- 엣지 컴퓨팅 디바이스(ECD)의 시간 변화하는 계산 능력을 고려하여 사용자 경험을 향상시키는 것이 핵심 목표입니다.
- 태스크 그래프 오프로딩 문제를 마르코프 의사결정 프로세스(MDP)로 모델링하고, 딥 강화 학습 알고리즘(SATA-DRL)을 설계하여 환경과의 상호작용을 통해 최적의 태스크 스케줄링 전략을 학습합니다.
- 시뮬레이션 결과, SATA-DRL이 기존 전략에 비해 평균 완료 시간과 데드라인 위반을 줄이는 데 우수한 성능을 보입니다.
Thống kê
엣지 컴퓨팅 디바이스 m의 처리 능력 δm은 시간에 따라 변화한다.
엣지 컴퓨팅 디바이스 m과 m'간의 전송률 Bm,m'는 알려져 있다.
모바일 사용자 n과 엣지 컴퓨팅 디바이스 mn 간의 전송률 Bm
n은 알려져 있다.
태스크 vni의 작업량 ρni는 알려져 있다.
태스크 vni에서 vnj로의 데이터 전송량 eni j는 알려져 있다.
Trích dẫn
"동적 MEC 환경에 완전히 적응하지 못하여 사용자 경험이 저하되는 문제가 발생한다."
"딥 강화 학습은 전문 지식이나 정확한 분석 모델 없이도 동적 환경에서 순차적 의사결정을 할 수 있는 유망한 방법이다."