음성 검증을 위해 병렬 Transformer와 DFSMN을 결합한 Voice Transformer 모델을 제안하였으며, 이를 통해 지역적 및 전역적 특징을 효과적으로 추출할 수 있었다.