Основные понятия
동적 환경에서 엣지 컴퓨팅 디바이스의 시간 변화하는 계산 능력을 고려하여 사용자 경험을 향상시키기 위한 딥 강화 학습 기반의 태스크 그래프 오프로딩 전략
Аннотация
이 논문은 모바일 엣지 컴퓨팅(MEC) 환경에서 태스크 그래프 오프로딩 문제를 다룹니다.
- 엣지 컴퓨팅 디바이스(ECD)의 시간 변화하는 계산 능력을 고려하여 사용자 경험을 향상시키는 것이 핵심 목표입니다.
- 태스크 그래프 오프로딩 문제를 마르코프 의사결정 프로세스(MDP)로 모델링하고, 딥 강화 학습 알고리즘(SATA-DRL)을 설계하여 환경과의 상호작용을 통해 최적의 태스크 스케줄링 전략을 학습합니다.
- 시뮬레이션 결과, SATA-DRL이 기존 전략에 비해 평균 완료 시간과 데드라인 위반을 줄이는 데 우수한 성능을 보입니다.
Статистика
엣지 컴퓨팅 디바이스 m의 처리 능력 δm은 시간에 따라 변화한다.
엣지 컴퓨팅 디바이스 m과 m'간의 전송률 Bm,m'는 알려져 있다.
모바일 사용자 n과 엣지 컴퓨팅 디바이스 mn 간의 전송률 Bm
n은 알려져 있다.
태스크 vni의 작업량 ρni는 알려져 있다.
태스크 vni에서 vnj로의 데이터 전송량 eni j는 알려져 있다.
Цитаты
"동적 MEC 환경에 완전히 적응하지 못하여 사용자 경험이 저하되는 문제가 발생한다."
"딥 강화 학습은 전문 지식이나 정확한 분석 모델 없이도 동적 환경에서 순차적 의사결정을 할 수 있는 유망한 방법이다."