Core Concepts
密集mmWave網絡において、アクセスポイントの限られたサービス能力と不安定なワイヤレスチャネルによる遅延を最小化するためのデータパケット伝送ポリシーを設計する。
Abstract
本論文では、密集かつセル自由なmmWave網絡におけるデータパケット伝送問題(mmDPT)を検討する。ユーザーがアクセスポイント(AP)にデータパケット要求を送信し、APがそれらのリクエストに応じてユーザーにデータパケットを送信するというシナリオを考える。目的は、APの限られたサービス能力と不安定なワイヤレスチャネル条件によって引き起こされる平均遅延を最小化することである。
この問題はRestless Multi-Armed Bandits with Fairness (RMAB-F)として定式化できる。最適なポリシーを見つけるのは計算量的に困難なため、既存の学習アルゴリズムは現実的な動的なmmWave環境に適用するのが難しい。
そこで本論文では、RMAB-Fに内在する構造を活用した構造化強化学習(RL)ソリューションを提案する。まず、RMAB-Fの低計算量かつ漸近的に最適なインデックスポリシーを設計する。次に、このインデックスポリシーの構造情報を活用して、mmDPT-TSと呼ばれる構造化TSアルゴリズムを開発する。mmDPT-TSは計算効率が高く、Bayesian regretが準最適な上界を持つことを示す。
実際のmmWave網絡からのデータを用いた評価実験では、提案手法が既存手法に比べて大幅な性能向上を示すことを確認した。
Stats
ユーザー1とAP3間のチャネル品質(EVM)は時間とともに大きく変動する。
ユーザー2とAP1間のチャネル品質(EVM)は時間とともに大きく変動する。
ユーザー3とAP3間のチャネル品質(EVM)は時間とともに大きく変動する。
Quotes
"密集かつセル自由なmmWave網絡において、ユーザーがアクセスポイント(AP)にデータパケット要求を送信し、APがそれらのリクエストに応じてユーザーにデータパケットを送信するというシナリオを考える。"
"目的は、APの限られたサービス能力と不安定なワイヤレスチャネル条件によって引き起こされる平均遅延を最小化することである。"
"既存の学習アルゴリズムは現実的な動的なmmWave環境に適用するのが難しい。"