Główne pojęcia
데이터 세트 유사성이 높을수록 예측 정확도가 높아지고 편향이 감소하며, 데이터 세트 다양성이 높을수록 예측 정확도와 불확실성 추정이 향상되지만 편향이 증가한다.
Streszczenie
이 연구는 데이터 세트 유사성과 다양성이 시계열 예측에서 전이 학습의 성공에 미치는 영향을 체계적으로 평가한다. 5개의 공개 소스 데이터 세트와 5개의 타겟 데이터 세트를 사용하여 실험을 수행했다.
소스-타겟 유사성 측정을 위해 두 가지 특징 기반 유사성 척도와 하나의 형태 기반 유사성 척도를 사용했다. 소스 데이터 세트 다양성은 특징 분산으로 정의했다.
실험 결과, 소스-타겟 유사성이 높을수록 예측 정확도가 높아지고 편향이 감소하며, 소스 데이터 세트 다양성이 높을수록 예측 정확도와 불확실성 추정이 향상되지만 편향이 증가한다. 이러한 관계는 파인튜닝보다 제로샷 예측에서 더 강하게 나타났다. 형태 기반 유사성 및 다양성 지표와 예측 성능 간에는 일관된 관계를 발견하지 못했다.
Statystyki
"소스-타겟 유사성이 높을수록 예측 정확도가 향상되고 편향이 감소한다."
"소스 데이터 세트 다양성이 높을수록 예측 정확도와 불확실성 추정이 향상되지만 편향이 증가한다."
Cytaty
"데이터 세트 유사성이 높을수록 예측 정확도가 높아지고 편향이 감소한다."
"데이터 세트 다양성이 높을수록 예측 정확도와 불확실성 추정이 향상되지만 편향이 증가한다."