Core Concepts
Reinforcement Learning kann eingesetzt werden, um die Suche nach geeigneten Quantenschaltkreisen zu verbessern, indem es Herausforderungen wie die Vorbereitung von Quantenzuständen und die Komposition von Unitäroperationen adressiert.
Abstract
Die Studie untersucht die Anwendung von Reinforcement Learning (RL) für das Design von Quantenschaltkreisen. Dabei werden zwei Hauptziele identifiziert:
Zustandsvorbereitung (State Preparation, SP): Finden einer Sequenz von Operationen, um einen gewünschten Quantenzustand aus einem Ausgangszustand zu erzeugen. Dies wird anhand der Erstellung von Bell-Zuständen, GHZ-Zuständen und zufälligen Zuständen evaluiert.
Unitärkomposition (Unitary Composition, UC): Zusammensetzen einer beliebigen Unitärtransformation aus einer endlichen Menge von Operationen. Hierfür werden die Hadamard-Operation, eine zufällige Operation und die Toffoli-Operation verwendet.
Für beide Ziele wird ein generisches RL-Framework für einen Quantenschaltkreis-Designer (QCD) definiert, das als Markov-Entscheidungsprozess formalisiert ist. Der QCD-Umgebung stehen kontinuierliche Aktionen zur Verfügung, um die direkte Optimierung der Parametrisierung der Quantengatter zu ermöglichen.
Die Evaluierung verschiedener state-of-the-art RL-Algorithome wie A2C, PPO, SAC und TD3 zeigt, dass diese Herausforderungen für RL-Methoden noch nicht trivial zu lösen sind. Insbesondere die Exploration des komplexen Aktionsraums und die Optimierung der Schaltkreistiefe und -breite stellen Schwierigkeiten dar. Die Ergebnisse legen nahe, dass weitere Forschung nötig ist, um RL für das Design von Quantenschaltkreisen effektiv einzusetzen.
Stats
Die Anzahl der verwendeten Qubits beträgt maximal 3.
Die maximale Tiefe der Quantenschaltkreise liegt bei 63.
Quotes
"Reinforcement Learning kann eingesetzt werden, um die Suche nach geeigneten Quantenschaltkreisen zu verbessern, indem es Herausforderungen wie die Vorbereitung von Quantenzuständen und die Komposition von Unitäroperationen adressiert."
"Insbesondere die Exploration des komplexen Aktionsraums und die Optimierung der Schaltkreistiefe und -breite stellen Schwierigkeiten dar."