Core Concepts
양자 확률론적 머신러닝에서 텐서 네트워크의 표현 및 일반화 능력은 데이터 학습을 통해 얻은 정보량에 의해 결정되며, 이는 손실 함수의 스케일링 법칙을 통해 해석될 수 있다.
Abstract
텐서 네트워크 기반 양자 확률론적 머신러닝에서의 보편적 스케일링 법칙: 표현 및 일반화 능력 해석
본 연구는 양자 확률론적 머신러닝에서 텐서 네트워크의 표현 및 일반화 능력을 해석하는 것을 목표로 한다. 특히, 행렬곱 상태(MPS) 형태의 생성적 텐서 네트워크(GTN)를 활용하여 데이터 학습을 통해 얻은 정보량이 손실 함수의 스케일링 법칙에 미치는 영향을 분석한다.
본 연구에서는 Fashion-MNIST, MNIST, Kuzushiji-MNIST, Human Activity Recognition 등 다양한 데이터셋을 사용하여 GTN 모델을 학습하고, 학습된 모델의 손실 함수(NLL)와 특징 수(M), 가상 차원(χ), 훈련 샘플 수(N) 간의 관계를 분석한다. 또한, 양자 특징 맵(QFM)의 직교성이 양자 확률론적 해석의 만족도 및 GTN의 일반화 능력에 미치는 영향을 조사한다.