核心概念
다중 모달 데이터의 특성을 고려하여 단계적으로 특징을 조정하고 융합함으로써 모델의 성능을 크게 향상시킬 수 있다.
摘要
이 논문은 다중 모달 데이터를 효과적으로 융합하는 새로운 방법인 단계적 융합(Stepwise Fusion, SF)을 제안한다. SF는 각 모달리티의 특징을 단계적으로 스케일링, 회전, 이동시켜 일관된 표현 공간을 만들어낸다. 이를 통해 다른 모달리티 간 높은 수준의 상호작용을 강력하게 포착할 수 있어 다중 모달 학습 성능을 크게 향상시킨다.
실험 결과, SF 모듈을 사용한 모델이 ETT와 MIT-BIH-Arrhythmia 데이터셋에서 최신 기술 수준을 능가하는 성능을 보였다. 또한 SF는 모델 파라미터 수를 크게 줄일 수 있어 더 효율적이고 사용하기 쉬운 것으로 나타났다.
统计
제안한 SF 모델이 ETT 데이터셋에서 기존 최신 기술 대비 MAE는 82.8%, MSE는 48.3% 향상되었다.
SF 모델이 MIT-BIH-Arrhythmia 데이터셋에서 기존 최신 기술 대비 정확도는 8.4%, F1 스코어는 8.5% 향상되었다.
SF 모듈을 사용한 모델의 파라미터 수는 기존 LMF 모델 대비 1백만 개 감소(1.4% 감소), Cross-attention 모델 대비 9천만 개 감소(56.3% 감소)하였다.
引用
"SF는 다른 모달리티 간 높은 수준의 상호작용을 강력하게 포착할 수 있어 다중 모달 학습 성능을 크게 향상시킨다."
"실험 결과, SF 모듈을 사용한 모델이 ETT와 MIT-BIH-Arrhythmia 데이터셋에서 최신 기술 수준을 능가하는 성능을 보였다."
"SF는 모델 파라미터 수를 크게 줄일 수 있어 더 효율적이고 사용하기 쉬운 것으로 나타났다."