핵심 개념
본 논문에서는 무선 통신 네트워크에서 완전 수동 지능형 반사 표면(IRS) 지원 최적의 단기/장기 빔포밍을 달성하기 위한 효율적인 데이터 기반 및 모델 없는 비지도 학습 알고리즘인 iZoSGA를 제안합니다.
초록
부정확한 오라클을 사용하는 수동 IRS 지원 시스템에서 2단계 빔포머의 데이터 기반 학습
본 논문에서는 무선 통신 네트워크에서 완전 수동 지능형 반사 표면(IRS) 지원 최적의 단기/장기 빔포밍을 달성하기 위한 효율적인 데이터 기반 및 모델 없는 비지도 학습 알고리즘을 개발합니다. 제안된 알고리즘은 부정확한 평가 오라클을 활용하여 목적 함수에 연속적인 불확실성과 알 수 없거나 "블랙박스" 항이 있는 2단계 확률적 비볼록 최적화 문제를 해결하는 데 적합한 제로차 확률적 경사 상승 방법론을 기반으로 합니다.
1. 기존 연구의 한계
기존의 IRS 지원 최적 빔포밍 연구는 주로 정교한 채널 모델과 자세한 시스템 구조(예: 공간 네트워크 토폴로지 및 IRS 구성)를 활용하여 순간적인 캐스케이드 채널 상태 정보(CSI)를 기반으로 (거의) 최적으로 조정된 IRS 요소를 찾는 특수 솔버를 설계하는 데 중점을 두었습니다. 이러한 접근 방식은 시뮬레이션 환경에서는 일반적으로 효과적이지만, 특히 수동 IRS 설정에서 매우 비현실적인 운영 가정을 수반하며, 실제 설정에 배포될 경우 상당한 계산 및 리소스 오버헤드를 발생시킵니다. 특히 매우 세분화되고 영구적인 순간 CSI 추정(또한 IRS에서의 능동 감지를 필요로 함)과 리소스 비효율적인 연속 IRS 최적 제어가 필요하기 때문입니다.
2. 제안하는 알고리즘: iZoSGA
본 논문에서는 이러한 문제를 해결하기 위해 iZoSGA(inexact Zeroth-order Stochastic Gradient Ascent)라는 새로운 오라클 기반, 데이터 기반 및 모델 없는 제로차 방법을 제안합니다. iZoSGA는 볼록 근사를 사용하지 않고도 일반적인 비볼록 2단계 확률적 프로그램을 직접 처리할 수 있습니다. iZoSGA는 매우 합리적이고 현실적인 가정 하에 (에르고딕하게) (비볼록) 2단계 확률적 프로그램의 임계점 근처에서 수렴한다는 것이 증명되었습니다. 동시에, 합계 레이트 최대화와 관련된 광범위한 실험에서 iZoSGA는 정확한 채널 모델, 관련 통계 및 특정 네트워크/IRS 구성에 대한 전체 지식을 활용하는 최첨단 SSCA 기반 대안보다 실질적으로 뛰어난 성능을 발휘하는 것으로 나타났습니다. 전반적으로 원래의 비볼록 문제를 해결함으로써 오라클 기반 제로차 방법은 이론적으로 근거가 있는 가정 하에 훨씬 낮은 계산/리소스 비용으로 상당히 높은 QoS를 산출하는 단기 빔포머와 최적화된 장기 IRS 매개변수를 공동으로 학습할 수 있음이 입증되었습니다.
3. 부정확한 오라클의 활용
기존의 ZoSGA 알고리즘은 단기 QoS 최대화를 위한 완벽한 오라클(즉, 주어진 최적화 문제에 대한 전역적으로 최적의 솔루션을 반환하는 "블랙박스")에 대한 액세스를 가정했습니다. 이 가정은 이중 레벨(또는 2단계) 최적화 관련 문헌에서 일반적으로 사용되는 일반적인 대안적 가정(즉, 2단계 최적 값 함수의 단일 값 가정)보다 훨씬 더 일반적이지만, 여전히 오라클 기반 제로차 알고리즘의 이론과 실제 사이에 장벽을 만듭니다. 실제로 수치 실험에서 해당 단기 프리코딩 문제는 잘 알려진 가중 최소 평균 제곱 오차(WMMSE) 알고리즘을 사용하여 고정된 반복 횟수 동안 대략적으로 "해결"되어 정확한 오라클 체제를 포기했습니다. 이러한 불일치에도 불구하고 수치 결과는 매우 유망했으며 ZoSGA가 실제로 IRS 지원 최적 빔포밍의 새로운 지평을 열었음을 보여주었습니다.
4. iZoSGA의 장점
본 논문에서 개발된 알고리즘인 iZoSGA는 실제로 기본 단기 빔포밍 문제에 대해 임의로 차선의 솔루션을 제공할 수 있는 일반적인 부정확한 오라클을 활용합니다. iZoSGA를 온화한 가정 하에 분석하고 원래 2단계 확률적 프로그램의 정지점 근처에서 (에르고딕) 수렴 속도를 설정합니다. 여기서 이러한 정지점에 대한 근접성은 이제 부정확한 오라클의 해당 오류에 의해 직접 제어됩니다. 기술적 분석을 통해 제안된 알고리즘이 반복될 때 오라클 자체 또는 속성에 대한 가정 없이 처음에는 오라클 오류 전파 역학을 보여줍니다. 그런 다음 단기/장기(수동) IRS 지원 최적 빔포밍의 맥락에서 자연스럽게 나타나는 광범위한 2단계 최적화 문제를 전문으로 함으로써 실제로 부정확한 오라클의 오류를 (합리적인 범위까지) 제어할 수 있음을 보여줍니다. 결과적으로, 여기서 제시된 분석을 사용하여 오라클 오류를 고려하여 알고리즘 설계를 알릴 수 있는 방법에 대한 귀중한 정보를 얻을 수 있으며, 이는 실제적인 가치가 있는 특수 체계를 설계할 수 있는 가능성을 제공합니다.