核心概念
조건부 확산 모델을 사용하여 개인, 세션 및 클래스별로 특정한 ERP 데이터를 생성할 수 있다.
摘要
이 연구에서는 분류기 없는 가이드를 사용하여 개인, 세션 및 클래스별로 특정한 EEG 데이터를 생성할 수 있는 새로운 조건부 확산 모델을 소개했다. 일반적으로 사용되는 메트릭 외에도 도메인 특정 메트릭을 도입하여 생성된 샘플의 특이성을 평가했다. 결과는 제안된 모델이 각 개인, 세션 및 클래스에 대해 실제 데이터와 유사한 EEG 데이터를 생성할 수 있음을 보여준다.
모델 성능 추세:
- 모델은 도메인 불변 메트릭(SWD)과 도메인 특정 메트릭(PAD, PLD, SD-MD)에서 세션 간 변동성을 능가한다.
- 분류기 성능(ABA) 측면에서는 실제 데이터 내 세션 기준선과 유사한 수준을 보인다.
- 모든 메트릭에서 100k-200k 단계 사이에 큰 성능 향상이 있었고, 이후 상대적으로 안정적이었다.
진폭, 지연 및 다양성 모델링:
- 분류기 성능은 실제 데이터와 매우 유사하며, 이는 진폭과 지연에 기반한 특징을 잘 모델링했음을 보여준다.
- 다양성 지표(SD-MD)도 세션 간 변동성을 능가하는 수준으로 모델링되었다.
PLD 지표의 한계:
- PLD는 실제 데이터에 유사한 높이의 다중 피크가 있을 때 신뢰할 수 없다. 이는 피크 선택 기준을 개선하거나 다중 부분집합을 사용하여 해결할 수 있다.
잠재적 활용:
- 타겟 클래스 샘플링을 통한 클래스 불균형 해소
- 분류기 학습을 위한 데이터 증강
- 다른 ERP 데이터셋에 대한 전이 학습
- 새로운 알고리즘 벤치마킹을 위한 데이터셋 확장
결론적으로, 제안된 모델은 개인, 세션 및 클래스별로 특정한 고품질의 EEG 데이터를 생성할 수 있다. 이는 전체 데이터셋으로 학습하면서도 샘플링 시 특이성을 유지할 수 있게 한다.
統計資料
실제 데이터와 생성 데이터 간 P300 피크 진폭 차이의 평균은 0.48 μV이다.
실제 데이터와 생성 데이터 간 P300 피크 지연 차이의 평균은 0.016 ms이다.