Core Concepts
Mixer는 다양한 관점에서 정보를 혼합하는 모델이다.
Abstract
MLP-Mixer가 컴퓨터 비전 분야에서 주목을 받고 있음
Audio Spectrogram Mixer with Roll-Time and Hermit FFT (ASM-RH) 모델 소개
ASM-RH은 오디오 데이터에 적합하며 다양한 분류 작업에서 유망한 결과 제공
Roll-Time-mixing 및 Hermit-Frequency-mixing 구조 소개
ASM-RH 모델의 구조 및 성능 평가
ASM-RH의 성능이 기존 모델을 능가하는 것을 실험 결과로 확인
Stats
ASM-RH 모델은 SpeechCommand, UrbanSound8K, CASIA Chinese Emotion Corpus에서 ERANNs를 능가하는 성능을 보여줌.
Quotes
"ASM-RH은 시간 및 주파수 도메인에서 정보를 효과적으로 캡처하는 모델이다."
"ASM-RH은 오디오 분류 작업에서 기존 모델을 능가하는 결과를 제공한다."