本論文では、インテリジェントIoTシステムのためのマルチプレイヤーマルチアームバンディットモデルを提案する。このモデルでは、エッジサーバーが近隣のサーバーと情報を交換し、センサーからデータを収集してタスクを完了する。
まず、サーバーの数Mと各サーバーの固有の順位を決定するための初期化スキームを提案する。次に、サーバー間の情報共有を可能にするための実行コンセンサス手順を導入する。これにより、各サーバーは他のサーバーの観測結果を活用してセンサーの期待データ率を協調的に推定できる。
提案するDC-ULCBアルゴリズムでは、各サーバーがUCBとLCBの両方を使ってセンサーの報酬を推定し、自身の順位に応じて異なるセンサーを選択することで、報酬の最大化と公平性の確保を両立する。
理論的な解析により、DC-ULCBのレグレット上限がログ時間に依存することを示す。また、シミュレーション結果から、DC-ULCBが既存手法に比べて報酬とPublicの両方で優れた性能を示すことを確認した。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Ziqun Chen,K... ב- arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11603.pdfשאלות מעמיקות