本論文では、量子回路設計における強化学習の課題について検討している。
まず、量子コンピューティングの基本概念を説明し、強化学習の基礎を概説する。次に、量子アーキテクチャ検索と量子回路最適化に関する先行研究を概観し、それらの課題を整理する。
具体的には、量子状態の準備(SP)と量子ユニタリ演算の合成(UC)の2つの目的を定義し、それらに対する報酬関数を設計する。さらに、これらの目的を達成するための一般的な強化学習フレームワークを提案する。
提案したフレームワークを用いて、A2C、PPO、SAC、TD3といった強化学習アルゴリズムの性能を評価する。結果として、これらのアルゴリズムでは量子回路設計の課題に対して十分な性能が得られないことが示された。特に、複雑な報酬関数や高次元の行動空間への対応が課題として挙げられる。
今後の展望として、より効果的な報酬設計や部分観測性の導入、近似シミュレーションの活用などが考えられる。また、量子エラー訂正などの課題への拡張も重要である。本研究は、量子コンピューティングと強化学習の融合に向けた基盤を提供するものと期待される。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Phil... lúc arxiv.org 04-05-2024
https://arxiv.org/pdf/2312.11337.pdfYêu cầu sâu hơn