Core Concepts
本文提出了一种基于分布式协作波束成形(DCB)的上行通信范式,以增强地面终端到低地球轨道(LEO)卫星的上行链路传输性能和持续时间。为了满足不同场景的需求,我们进行多目标优化分析并提出了一个长期优化问题。为了应对不同规模的终端集群,我们将该问题重新表述为一个动作空间缩减和通用的多目标马尔可夫决策过程。然后,我们提出了一种进化的多目标深度强化学习算法来获得理想的策略,其中通过屏蔽低价值动作来加快训练过程。这样,一次训练的模型的适用性可以覆盖更多变化的地面-卫星上行链路场景。
Abstract
本文提出了一种基于分布式协作波束成形(DCB)的地面-太空直接通信方法。DCB将无法直接与低地球轨道(LEO)卫星建立有效连接的终端视为分布式天线,形成一个虚拟天线阵列,以增强终端到卫星的上行链路可实现速率和持续时间。
为了满足不同场景的需求,该系统需要多个权衡策略,平衡终端-卫星上行链路可实现速率、终端能耗和卫星切换频率。因此,我们进行了多目标优化分析,并将其建模为一个长期优化问题。
为了应对不同规模的终端集群,我们将问题重新表述为一个动作空间缩减和通用的多目标马尔可夫决策过程。然后,我们提出了一种进化的多目标深度强化学习算法来获得理想的策略,其中通过屏蔽低价值动作来加快训练过程。这样,一次训练的模型的适用性可以覆盖更多变化的地面-卫星上行链路场景。
仿真结果表明,所提出的算法优于各种基准算法。此外,发现DCB使无法达到上行链路可实现阈值的终端也能实现有效的直接上行传输,这表明DCB是实现地面-太空直接通信的有效解决方案。此外,所提出的算法还能实现偏好不同目标的多个策略,并以较低的切换频率实现近最优的上行链路可实现速率。
Stats
终端i在时隙t与卫星ℓ之间的信道系数为:
hi,ℓ(t) = √β0d−α
i,ℓejψi,ℓ(t)
在时隙t,虚拟天线阵列接收到的信号为:
y(t) = ∑∀i∈I √Pi(t)β0d−α
i,stej(ϕi(t)+ψi,st(t))s + v
信噪比(SNR)为:
γSNR(t) = ∑∀i∈I √Pi(t)β0d−α
i,st 2/σ2
上行链路可实现速率为:
R(t) = B log2(1 + γSNR(t))