Conceptos Básicos
Proposing a quantum-inspired reinforcement learning algorithm that enhances exploration-exploitation trade-off.
Resumen
研究者は、量子力学の超位相原理に着想を得た新しい強化学習アルゴリズムを提案しています。このアルゴリズムは、探索と活用のトレードオフを向上させることを目的としており、古典的な強化学習に量子コンピューティングからのアイデアを取り入れています。最初に古典コンピューターでシミュレートされた量子スーパーポジションに基づくアクション選択手法が提案され、後に実際の量子コンピューターで実行可能な形式に変換されました。この手法は、各状態ごとに可能なアクションが観測可能性の固有状態で表現され、これらの状態の重ね合わせが作成されます。観測時、状態は選択されたアクションに関連付けられた固有状態に収束し、エージェントがそのアクションを実行します。報酬と新しい状態を受け取った後、Grover演算子が以前に選択されたアクションに対応する振幅を増幅するよう適用されます。
Estadísticas
Ref. [Don+08b]: Dong, D. "Quantum reinforcement learning"
Ref. [Don+06a]: Dong, D. "Quantum mechanics helps in learning for more intelligent robots"
Ref. [CDC06]: Chen, C.-L. "Quantum computation for action selection using reinforcement learning"
Ref. [Don+06b]: Dong, D. "Quantum Robot: Structure, Algorithms and Applications"
Ref. [Che+06]: Chen, C.-L. "Superposition-Inspired Reinforcement Learning and Quantum Reinforcement Learning"
Ref. [CD08]: Chen, C.-L. "A Quantum Reinforcement Learning Method for Repeated Game Theory"
Ref. [Don+08a]: Dong, D. "Incoherent Control of Quantum Systems With Wavefunction-Control...
Ref. [CD10]: Chen, C.-L. "Complexity analysis of Quantum reinforcement learning"
Ref. [Don+12]: Dong, D. "Robust Quantum-Inspired Reinforcement Learning for Robot Navigation"
Ref. [CFD12]: Chunlin, C., et al., "Hybrid control of uncertain quantum systems via fuzzy estimation and quantum reinforcement learning"
Citas
"The authors propose an algorithm that modifies the action-selection procedure and balances exploration and exploitation in a novel way."
"Dong et al.'s work discusses how to execute the proposed algorithm on actual quantum devices – which did not exist at this time."
"The stochastic policy is replaced by a quantum superposition for each state s representing possible actions as eigenstates of some observable."