본 연구는 최근 제안된 Mamba 상태 공간 모델을 활용하여 효율적인 스트리밍 음성 인식 모델을 개발하였다. 또한 유니모달 집계 기법을 통해 토큰 경계를 명시적으로 탐지하고 토큰 출력을 트리거하는 방식을 제안하였다.