Core Concepts
ConFides는 자동 음성 인식 출력의 신뢰도를 시각적으로 표현하여 분석가들이 음성 데이터를 더 효과적으로 탐색하고 편집할 수 있도록 지원합니다.
Abstract
이 논문에서는 ConFides라는 새로운 시각적 분석 시스템을 소개합니다. ConFides는 분석가들과의 협업을 통해 개발되었으며, 자동 음성 인식(ASR) 출력의 신뢰도를 시각적으로 표현하여 분석가들이 음성 데이터를 더 효과적으로 탐색하고 편집할 수 있도록 지원합니다.
ConFides의 주요 기능은 다음과 같습니다:
- 신뢰도 개요 뷰: 전체 음성 전사 내용의 신뢰도 수준을 한눈에 파악할 수 있습니다.
- 전사 편집기: 각 단어의 신뢰도 수준을 시각적으로 표현하여 오류를 쉽게 식별하고 수정할 수 있습니다.
- 문맥 단어 트리: 특정 키워드의 문맥을 시각화하여 해당 단어의 사용 맥락을 파악할 수 있습니다.
이를 통해 분석가들은 음성 데이터를 더 효과적으로 탐색하고 분석할 수 있으며, 신뢰도 정보를 바탕으로 인간-기계 협업을 개선할 수 있습니다. 또한 텍스트 데이터 정제와 모델 투명성 향상을 위한 기회를 제시합니다.
Stats
라인 707의 "pandas"라는 단어의 신뢰도 점수는 52%입니다.
라인 709에서 "April 1st"라는 문구가 두 번 등장하며, 신뢰도 점수가 100%입니다.
라인 704에는 San Diego, St. Louis, New York, Chicago 등 여러 도시 이름이 등장하며, 신뢰도 점수가 93-100%입니다.
Quotes
"Confidence scores of automatic speech recognition (ASR) outputs are often inadequately communicated, preventing its seamless integration into analytical workflows."
"Relying on AI, especially in human-machine collaborations, without awareness of these uncertainties can be detrimental, as the quality of an analyst's work is a direct result of the trust in and accuracy of the information presented to them."