Core Concepts
TV 뉴스 자막 해석 영상에서 수집한 대규모 홍콩 수화 데이터셋을 소개하며, 이를 활용한 대규모 연속 수화 인식 및 번역 연구를 수행한다.
Abstract
이 논문은 TV 뉴스 프로그램에서 수집한 홍콩 수화(HKSL) 데이터셋 TVB-HKSL-News를 소개한다. 이 데이터셋은 대규모 연속 수화 인식(SLR) 및 번역(SLT) 연구를 지원하기 위해 만들어졌다.
데이터셋 구성:
총 16.07시간의 수화 영상, 2명의 수화 통역사 출연
6,515개의 수화 단어(SLR) 및 2,850개의 중국어 문자(SLT) 어휘
자동화된 데이터 수집 파이프라인을 통해 수화 영상과 자막 텍스트를 수집하고, 전문 수화 통역사의 수동 주석을 통해 수화 단어 레이블을 생성
실험 결과:
최신 SLR/SLT 모델을 적용하여 기준 성능 제시 (SLR WER 34.08%, SLT BLEU-4 23.58)
단일 통역사 데이터 활용 실험을 통해 데이터 양이 SLR/SLT 성능에 미치는 영향 분석
이 데이터셋은 HKSL 연구를 위한 귀중한 자원이 될 것이며, 대규모 연속 SLR 및 SLT 모델 개발에 기여할 것으로 기대된다.
Stats
어제 기온은 20도, 습도는 76%였습니다.
수입 사례 중 한 명은 인도 선원이었습니다.
Quotes
"이 데이터셋은 HKSL 연구를 위한 귀중한 자원이 될 것이며, 대규모 연속 SLR 및 SLT 모델 개발에 기여할 것으로 기대된다."
"데이터 양이 SLR/SLT 성능에 미치는 영향을 분석한 결과, SLR의 경우 약 8시간의 데이터면 충분하지만 SLT는 더 많은 데이터가 필요한 것으로 나타났다."