Основні поняття
양자 신경망(QNN)에서 널리 사용되는 하드웨어 효율적인 안사츠(HEA)는 매개변수 업데이트 시 모델 공간에서 제한적인 구별 가능성을 보여 학습 성능 저하에 영향을 미칠 수 있습니다.
Анотація
양자 신경망 아키텍처 분석: 채널 구별 가능성과 학습 어려움
본 연구 논문에서는 양자 신경망(QNN)의 핵심 구성 요소인 안사츠, 특히 하드웨어 효율적인 안사츠(HEA)의 모델 공간을 심층 분석합니다. 저자들은 안사츠의 표현력, 즉 표현 가능한 연산 공간을 조사하고, 널리 사용되는 척도인 2-디자인과의 근접성이 이러한 속성을 제대로 포착하지 못한다고 주장합니다.
기존 연구에서는 안사츠의 표현력을 측정하기 위해 유니터리 그룹에 대한 균일 분포인 Haar 측정값과 안사츠에 의해 생성된 유니터리의 확률 분포 간의 유사성을 평가하는 방법을 사용했습니다. 특히, t-차 모멘트까지 유니터리의 확률 분포가 Haar 측정값을 따를 때 안사츠를 t-디자인으로 간주합니다.
본 논문에서는 2-디자인의 표현력을 측정하기 위해 Welch Bound를 사용합니다. Welch Bound는 벡터 공간에 유한한 수의 단위 벡터를 균등하게 분포시키는 것과 관련된 부등식입니다. t-디자인 기반 아키텍처에 대한 Welch Bound를 비교한 결과, t 값이 증가함에 따라 상태 벡터 항 간의 중첩이 감소하여 t-디자인(t > 2)이 2-디자인보다 상태 공간에서 더 균일하게 분포됨을 알 수 있습니다. 즉, 2-디자인 모델은 복잡한 양자 회로를 구축할 때 자유도가 훨씬 낮으며, 이는 표현력이 제한적임을 의미합니다.
저자들은 2-디자인의 한계를 극복하기 위해 모델 공간의 지역적 이웃, 특히 매개변수의 작은 변화에 대한 모델 구별 가능성을 분석하는 대안적인 방법을 제시합니다.
구체적으로, 양자 정보 이론에서 사용되는 다이아몬드 노름을 사용하여 매개변수 업데이트 시 양자 회로, 즉 적용된 연산이 어떻게 변하는지 분석합니다. 다이아몬드 노름은 두 CPTP(Completely Positive and Trace Preserving) 양자 채널 E1과 E2 사이의 거리를 측정하는 데 사용되며, 값이 0이면 구별할 수 없음을, 2이면 완벽하게 구별 가능함을 의미합니다.
저자들은 매개변수 ϑ를 가진 유니터리 U(ϑ)와 섭동된 유니터리 U(ϑ + δ) 사이의 구별 가능성을 평가하기 위해 다이아몬드 노름을 적용하고 이를 채널 민감도로 정의합니다.