이 논문은 우르두어 자동 음성 인식(ASR) 모델의 포괄적인 성능 평가를 제시한다. Whisper, MMS, Seamless-M4T 3가지 ASR 모델 군을 Word Error Rate(WER) 기준으로 분석하며, 가장 빈번한 잘못된 단어와 삽입, 삭제, 대체 오류 유형을 자세히 살펴본다.