Core Concepts
테스트 시간 학습(TTT)을 통해 다양한 분포 변화에 강건한 우울증 탐지 모델을 개발할 수 있다.
Abstract
이 연구는 우울증 탐지 모델의 강건성을 높이기 위해 테스트 시간 학습(TTT) 기법을 적용했다. 기존 연구에서는 학습 데이터와 테스트 데이터가 유사한 환경에서 수집되었지만, 실제 환경에서는 배경 소음, 성별, 데이터 수집 방식 등의 차이로 인해 분포 변화가 발생할 수 있다. 이로 인해 우울증 탐지 모델의 성능이 크게 저하될 수 있다.
이 연구에서는 TTT 기법을 적용하여 다음과 같은 분포 변화에 대한 강건성을 확인했다:
배경 소음: 깨끗한 음성으로 학습하고 소음이 포함된 음성으로 테스트
성별 편향: 여성 화자 데이터로 학습하고 남성 화자 데이터로 테스트, 반대의 경우도 실험
데이터셋 차이: 서로 다른 데이터셋(CLD, DAIC-WOZ)에서 학습과 테스트 수행
실험 결과, TTT를 적용한 AudioMAE 모델이 다양한 분포 변화에서 기존 모델 대비 월등한 성능을 보였다. 이를 통해 TTT가 우울증 탐지 모델의 강건성 향상에 효과적임을 확인할 수 있었다.
Stats
배경 소음이 5dB 수준으로 추가된 경우, AudioMAE-TTT 모델의 매크로 F-점수는 평균 59.5%로 다른 모델 대비 크게 향상되었다.
성별 편향 실험에서 AudioMAE-TTT 모델은 여성 화자 데이터로 학습하고 남성 화자 데이터로 테스트할 때 63.1%의 매크로 F-점수를 보였다. 이는 다른 모델 대비 크게 높은 수준이다.
데이터셋 차이 실험에서 AudioMAE-TTT 모델은 CLD 데이터로 학습하고 DAIC-WOZ 데이터로 테스트할 때 48.7%의 매크로 F-점수를 보였다. 이는 다른 모델 대비 크게 향상된 결과이다.