Core Concepts
Whisper는 스위스 독일어 음성을 상당히 잘 인식하고 표준 독일어로 번역할 수 있다.
Abstract
이 연구는 Whisper의 스위스 독일어 성능을 체계적으로 평가했다. 자동 평가(WER, BLEU), 정성 분석, 인간 평가(설문조사)를 수행했다.
자동 평가 결과, Whisper는 기존 모델들과 견줄만한 성능을 보였다. 정성 분석에서는 Whisper의 출력이 대체로 원문의 의미를 잘 유지하고 있으나, 일부 문법 요소(접속사, 조사 등)가 누락되거나 변형되는 경향이 있었다. 인간 평가에서도 Whisper 출력에 대한 높은 만족도가 확인되었다.
종합적으로 Whisper는 스위스 독일어 음성을 표준 독일어로 번역하는 데 유용하게 활용될 수 있다. 다만 일부 오류(환청 등)가 발생할 수 있으므로 주의가 필요하다.
Stats
스위스 독일어 음성을 표준 독일어로 번역할 때 Whisper의 WER은 0.24-0.37, BLEU는 44.19-63.1 수준이다.
스위스 독일어 방언별로 Whisper의 성능 편차가 크다. 그리손스 방언이 가장 좋고 발레르 방언이 가장 나쁘다.
Whisper의 출력에서 일부 문장이 환청으로 생성되는 경우가 있다.
Quotes
"Whisper는 스위스 독일어 음성을 상당히 잘 인식하고 표준 독일어로 번역할 수 있다."
"Whisper의 출력은 대체로 원문의 의미를 잘 유지하고 있으나, 일부 문법 요소가 누락되거나 변형되는 경향이 있다."
"Whisper는 스위스 독일어 음성을 표준 독일어로 번역하는 데 유용하게 활용될 수 있지만, 일부 오류가 발생할 수 있으므로 주의가 필요하다."