이 연구에서는 ZX-다이어그램을 강화 학습 기반 에이전트로 최적화하는 방법을 제안한다. ZX-다이어그램은 양자 프로세스를 표현하는 강력한 그래픽 언어로, 다양한 응용 분야에 활용된다. 이 다이어그램을 최적화하기 위해서는 변환 규칙을 적용하는 최적의 순서를 찾는 것이 중요하지만 어려운 문제이다.
저자들은 강화 학습 기술과 그래프 신경망을 결합하여 이 문제를 해결한다. 에이전트는 ZX-다이어그램을 입력받아 변환 규칙을 적용하는 최적의 순서를 학습한다. 이때 노드 수 감소를 보상으로 사용한다. 실험 결과, 학습된 에이전트는 휴리스틱 전략이나 시뮬레이티드 어닐링 기법보다 우수한 성능을 보였으며, 훈련 데이터보다 훨씬 큰 다이어그램에 대해서도 일반화가 잘 되었다.
이 연구는 ZX-다이어그램을 활용한 다양한 문제, 예를 들어 양자 회로 최적화나 텐서 네트워크 시뮬레이션 가속화 등에 강화 학습을 적용할 수 있는 기반을 마련했다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究