核心概念
本稿では、遅延の影響を受けやすい無線通信システムにおいて、パケットレベルの遅延ジッターを最小限に抑えつつ、遅延制約を満たすための、リアプノフ最適化とQMIXアルゴリズムを用いた二段階のインテリジェントスケジューリングアルゴリズムを提案する。
要約
リアプノフガイド付きQMIXを用いた無線パケットスケジューリング
本稿では、遅延の影響を受けやすい無線通信システム、特に産業用プロセス制御のような超信頼低遅延通信(URLLC)シナリオにおいて、パケットレベルの遅延ジッターを最小限に抑えつつ、遅延制約を満たすための、リアプノフ最適化とQMIXアルゴリズムを用いた二段階のインテリジェントスケジューリングアルゴリズムを提案している。
従来の無線リソーススケジューリングアルゴリズムでは、遅延違反を最適化の目的関数として扱い、遅延違反確率を最小化するアプローチが主流であった。しかし、産業オートメーションや遠隔医療のような時間制約の厳しいシナリオでは、遅延ジッターがデータ伝送の不安定性につながり、システムの応答性と処理効率に悪影響を及ぼす可能性がある。
本稿では、このような問題意識に基づき、遅延ジッターを最小限に抑えつつ、確率的な遅延制約を保証する、新しい無線パケットスケジューリングアルゴリズムの開発を目的とする。
提案するアルゴリズムは、リアプノフ最適化とQMIXアルゴリズムを用いた二段階の構造を持つ。
第一段階:リアプノフ最適化による遅延制約の変換
第一段階では、リアプノフ最適化の手法を用いて、長期的な遅延違反確率の制約を、仮想キューの安定条件に変換する。具体的には、システムのバックログの変化を表すリアプノフドリフトを最小化することで、実際のキューと仮想キューを安定させ、遅延制約を保証する。
第二段階:QMIXによるインテリジェントパケットスケジューリング
第二段階では、リソースを直接割り当てる際に生じるアクション空間の増大に対処するため、階層的なQMIXベースのマルチエージェント強化学習アルゴリズムを導入する。各ユーザーに対してエージェントを構築し、各エージェントはユーザーのバッファ状態やチャネル状態などの観測情報に基づいて、ユーザーの優先度と送信するデータパケット数を決定する。