Core Concepts
수어 언어 번역 문제를 두 가지 하위 작업인 글로스 선택(GS)과 글로스 재정렬(GR)로 분해하여 해결하는 새로운 접근법을 제안한다.
Abstract
이 논문은 수어 언어 번역을 위한 새로운 접근법인 선택 및 재정렬(S&R) 방법을 소개한다. 수어 언어 번역은 일반적으로 두 가지 하위 작업으로 구성되는데, 하나는 구어 문장을 글로스 시퀀스로 변환하는 텍스트-글로스(T2G) 번역이고, 다른 하나는 글로스 시퀀스를 수어 동작으로 변환하는 글로스-수어(G2S) 변환이다.
S&R 방법은 T2G 번역 문제를 두 단계로 분해한다. 첫 번째 단계인 글로스 선택(GS)에서는 구어 문장에 해당하는 글로스를 선택한다. 이를 위해 대규모 구어 언어 모델과 소스 언어와 타겟 언어 간 어휘 중복을 활용하여 초기 정렬을 수행한다. 두 번째 단계인 글로스 재정렬(GR)에서는 구어 순서의 글로스를 수어 순서로 재정렬한다. 이를 위해 통계 기반 사전 재정렬 방법과 딥러닝 기반 방법을 제안한다.
GS와 GR 모두 비자기회귀(NAR) 디코딩을 사용하여 계산 비용을 줄이고 추론 속도를 높인다. 이 두 단계를 결합하여 mDGS와 PHOENIX14T 데이터셋에서 최신 BLEU 및 Rouge 점수를 달성한다. 이 혁신적인 접근법은 자원 제한 환경에서도 수어 언어 번역 모델의 효과적인 개발을 가능하게 한다.
Stats
독일어 수어 언어 데이터셋 mDGS에서 GS 모델은 BLEU-1 점수 42.91을 달성했다.
독일어 수어 언어 데이터셋 PHOENIX14T에서 GS 모델은 BLEU-1 점수 62.69를 달성했다.
통계 기반 GR 모델은 PHOENIX14T 데이터셋에서 BLEU-4 점수 53.44를 달성했다.
제안한 S&R 접근법은 PHOENIX14T 데이터셋에서 BLEU-1 점수 12.65% 향상, mDGS 데이터셋에서 BLEU-1 점수 37.88% 향상을 달성했다.
Quotes
"수어 언어는 시각적 의사소통 형태로, 수동 제스처와 비수동적 특징을 통해 표현된다."
"수어 언어 생성(SLP)은 구어 문장으로부터 연속적인 수어 시퀀스를 생성하는 것을 목표로 한다."
"S&R 접근법은 T2G 번역 문제를 두 하위 작업인 글로스 선택(GS)과 글로스 재정렬(GR)로 분해한다."