Core Concepts
음성 인식에서 신경 기반 음향 모델이 포함하는 정보의 복잡성과 다양성을 탐구합니다.
Abstract
딥러닝 아키텍처의 성과와 정보의 복잡성
음향 모델의 정보 위치와 특성 분석
다양한 실험 결과와 정보 유형의 발견
음성 인식 분야의 미래 전망
Stats
AM 정확도가 최근 DNN을 사용하여 향상되었습니다.
TDNN-F 모델은 16개의 숨겨진 레이어를 포함하고 있습니다.
Speaker verification, acoustic environment classification, gender classification, tempo-distortion detection systems 및 speech sentiment/emotion identification에 대한 실험 수행.
Quotes
"음성 신호에 포함된 정보는 화자, 음향 환경 또는 감정 및 감정과 관련된 정보를 포함합니다."
"낮은 수준의 레이어는 주변 소음을 더 잘 인식하며, 음향 환경 작업에서 Layer4에서 최상의 성능을 달성합니다."