核心概念
데이터 부족 환경에서 기존 데이터셋을 활용하여 새로운 수화 데이터셋의 인식 성능을 향상시킬 수 있는 전이 학습 기법을 제안한다.
摘要
이 연구는 터키어 수화 데이터셋인 BSign22k와 AUTSL을 활용하여 교차 데이터셋 고립 수화 인식을 위한 전이 학습 벤치마크를 제공한다.
- 두 데이터셋에서 57개의 공통 수화 동작을 선별하여 실험 데이터셋을 구축하였다.
- 시간 그래프 합성곱 기반의 수화 인식 모델을 사용하여 5가지 지도 학습 기반 전이 학습 기법을 평가하였다.
- 폐쇄 집합 및 부분 집합 교차 데이터셋 전이 학습 실험을 수행하였다.
- 실험 결과, 기존 fine-tuning 기반 전이 학습 방식보다 전문화된 지도 학습 기반 전이 학습 기법이 성능 향상을 보였다.
- 이 연구는 데이터 부족 환경의 수화 인식 및 비디오 분류 작업에 대한 기준선 연구가 될 것이다.
統計資料
데이터셋 BSign22k에는 744개의 수화 동작과 22,542개의 비디오가 있으며, AUTSL 데이터셋에는 216개의 수화 동작과 31,881개의 비디오가 있다.
두 데이터셋에서 선별한 57개의 공통 수화 동작에 대해 BSign22kshared 데이터셋에는 1,994개의 비디오, BSign22ksingle 데이터셋에는 875개의 비디오, AUTSLshared 데이터셋에는 8,011개의 비디오가 있다.
引述
"데이터 부족 환경에서 기존 데이터셋을 활용하여 새로운 수화 데이터셋의 인식 성능을 향상시킬 수 있는 전이 학습 기법을 제안한다."
"실험 결과, 기존 fine-tuning 기반 전이 학습 방식보다 전문화된 지도 학습 기반 전이 학습 기법이 성능 향상을 보였다."