이 논문은 스트리밍 신경망 모델의 학습 성능을 향상시키기 위한 새로운 손실 함수인 스트리밍 앵커 손실(Streaming Anchor Loss, SAL)을 제안한다.
SAL은 모델 학습 시 시간적으로 중요한 프레임에 더 큰 가중치를 부여하여 모델이 해당 프레임을 더 잘 예측할 수 있도록 한다. 이를 위해 SAL은 과업별 앵커 프레임(task anchor frames)을 정의하고, 이 앵커 프레임에 가까운 프레임일수록 더 큰 가중치를 부여한다.
실험 결과, SAL을 사용한 모델이 기존 손실 함수 대비 키워드 검출, 멀티모달 트리거 검출, 음성 시작 검출 등의 과업에서 정확도와 지연 시간이 향상되었다. 이는 제한된 모델 용량에서도 SAL이 중요한 프레임에 모델의 학습 자원을 집중시켜 전반적인 과업 성능을 높일 수 있음을 보여준다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Utkarsh Oggy... at arxiv.org 04-19-2024
https://arxiv.org/pdf/2310.05886.pdfDeeper Inquiries