이 논문은 다음과 같은 내용을 다룹니다:
다중 마르코프 소스의 원격 추정 문제를 평균 비용 제약 마르코프 의사결정 프로세스(CMDP)로 정식화합니다. 이는 전송 빈도 제약 하에서 장기적인 추정 오류 비용을 최소화하는 것을 목표로 합니다.
최적 정책의 구조를 분석하고, 이를 바탕으로 효율적인 정책 탐색 알고리즘인 Insec-RVI를 제안합니다. Insec-RVI는 최적 정책을 소수의 반복으로 찾을 수 있습니다.
마르코프 의사결정 프로세스의 차원 저주 문제를 해결하기 위해 Lyapunov 최적화 기반의 온라인 저복잡도 스케줄링 정책을 제안합니다.
사전에 채널 및 소스 통계를 모르는 경우를 위해 평균 비용 Q-learning 알고리즘을 설계합니다.
수치 결과를 통해 연속 전송이 비효율적이며, 제안된 의미론적 인지 정책이 중요한 정보를 전략적으로 활용하여 최적의 성능을 달성할 수 있음을 보여줍니다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Jiping Luo,N... klokken arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16855.pdfDypere Spørsmål