Główne pojęcia
대규모 언어 모델(LLM)을 활용하여 노이즈가 있는 환경을 포함한 다양한 조건에서 양자 상태를 효율적으로 시뮬레이션하는 방법을 제시하고, 이를 단일 큐비트에서 3 큐비트 시스템까지 확장하여 그 정확성과 효율성을 검증했습니다.
Streszczenie
대규모 언어 모델 기반 양자 시뮬레이터 연구 논문 요약
본 연구 논문에서는 대규모 언어 모델(LLM)을 활용하여 양자 상태를 시뮬레이션하는 새로운 접근 방식을 제시합니다. 기존 양자 시뮬레이터의 한계점과 실제 양자 컴퓨터 구축의 높은 비용을 고려했을 때, LLM은 복잡한 패턴 인식 및 시퀀스 데이터 처리 능력을 바탕으로 양자 회로 시뮬레이션에 효과적인 도구가 될 수 있습니다.
본 연구에서는 LLM을 기반으로 양자 회로의 매개변수와 그에 상응하는 양자 상태 간의 관계를 모델링하고 예측하는 머신러닝 프레임워크를 제안합니다.
데이터 수집: 단일 큐비트 및 2 큐비트 양자 회로를 설계하고, 회전 게이트 매개변수와 시뮬레이션 결과로 얻은 양자 상태 벡터 또는 밀도 행렬을 포함하는 데이터 세트를 구축했습니다. 노이즈가 있는 시나리오를 위해 실제 양자 컴퓨터(SpinQ Gemini mini pro)에서 데이터를 수집하고, 상태 토모그래피 및 볼록 최적화 기술을 사용하여 밀도 행렬을 재구성했습니다.
모델 학습: 인코더-디코더 구조, 셀프 어텐션 메커니즘, 오토리그레시브 메커니즘을 포함하는 LLM 모델을 설계하고, 평균 제곱 오차(MSE)를 손실 함수로 사용하여 모델을 학습했습니다.
모델 검증: 학습된 모델을 사용하여 Grover 알고리즘 및 변분 양자 고유값 솔버(VQE)와 같은 양자 알고리즘을 시뮬레이션하고, 그 결과를 이론적 예측값 및 기존 시뮬레이터(Qiskit)의 결과와 비교했습니다.