toplogo
Sign In

홍콩 수화 데이터셋: TV 뉴스 자막 해석 영상에서 수집


Core Concepts
TV 뉴스 자막 해석 영상에서 수집한 대규모 홍콩 수화 데이터셋을 소개하며, 이를 활용한 대규모 연속 수화 인식 및 번역 연구를 수행한다.
Abstract
이 논문은 TV 뉴스 프로그램에서 수집한 홍콩 수화(HKSL) 데이터셋 TVB-HKSL-News를 소개한다. 이 데이터셋은 대규모 연속 수화 인식(SLR) 및 번역(SLT) 연구를 지원하기 위해 만들어졌다. 데이터셋 구성: 총 16.07시간의 수화 영상, 2명의 수화 통역사 출연 6,515개의 수화 단어(SLR) 및 2,850개의 중국어 문자(SLT) 어휘 자동화된 데이터 수집 파이프라인을 통해 수화 영상과 자막 텍스트를 수집하고, 전문 수화 통역사의 수동 주석을 통해 수화 단어 레이블을 생성 실험 결과: 최신 SLR/SLT 모델을 적용하여 기준 성능 제시 (SLR WER 34.08%, SLT BLEU-4 23.58) 단일 통역사 데이터 활용 실험을 통해 데이터 양이 SLR/SLT 성능에 미치는 영향 분석 이 데이터셋은 HKSL 연구를 위한 귀중한 자원이 될 것이며, 대규모 연속 SLR 및 SLT 모델 개발에 기여할 것으로 기대된다.
Stats
어제 기온은 20도, 습도는 76%였습니다. 수입 사례 중 한 명은 인도 선원이었습니다.
Quotes
"이 데이터셋은 HKSL 연구를 위한 귀중한 자원이 될 것이며, 대규모 연속 SLR 및 SLT 모델 개발에 기여할 것으로 기대된다." "데이터 양이 SLR/SLT 성능에 미치는 영향을 분석한 결과, SLR의 경우 약 8시간의 데이터면 충분하지만 SLT는 더 많은 데이터가 필요한 것으로 나타났다."

Deeper Inquiries

HKSL 이외의 다른 수화 언어에도 이와 유사한 데이터셋을 구축할 수 있을까

TVB-HKSL-News 데이터셋은 홍콩 수화 언어(HKSL)에 대한 데이터셋이지만, 이와 유사한 방법으로 다른 수화 언어에 대한 데이터셋을 구축할 수 있습니다. 다른 수화 언어에 대한 데이터셋을 구축할 때에는 해당 언어의 특성과 문법을 고려하여 수화 동작을 적절히 표현하는 glosses나 텍스트를 수집해야 합니다. 또한, 수화 인터프리터의 동작을 감지하고 텍스트를 추출하는 자동화된 파이프라인을 구축하여 데이터 수집을 효율적으로 진행할 수 있습니다.

단일 통역사 데이터를 활용한 SLR/SLT 모델 성능 향상을 위해 어떤 새로운 기술적 접근이 필요할까

단일 통역사 데이터를 활용한 SLR/SLT 모델의 성능을 향상시키기 위해서는 다양한 기술적 접근이 가능합니다. 첫째, 키 포인트 정보를 활용하여 시각적 모듈이 정보를 집중할 수 있도록 하는 방법이 효과적일 수 있습니다. 둘째, 시공간적 모델링 능력이 뛰어난 모델을 활용하여 시간적 의존성을 잘 모델링하는 것이 중요합니다. 또한, 다중 모달리티 학습을 통해 비디오와 키 포인트 정보를 효과적으로 결합하는 방법도 고려할 수 있습니다.

수화 언어 이해와 관련하여 이 데이터셋이 어떤 방식으로 활용될 수 있을까

TVB-HKSL-News 데이터셋은 수화 언어 이해와 관련하여 다양한 방식으로 활용될 수 있습니다. 첫째, 대규모 수화 언어 인식 및 번역 모델의 개발을 지원하여 수화 커뮤니티에 혁신적인 기술을 제공할 수 있습니다. 둘째, 다른 수화 언어나 의사소통 장애인을 위한 보조 수단으로 활용될 수 있어 사회적으로 매우 의미 있는 데이터셋입니다. 추가적으로, 다양한 연구 및 응용 분야에서 수화 언어의 이해와 활용을 증진시키는 데 활용될 수 있습니다.
0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star