Core Concepts
Formation Tree를 활용하여 중국어 문자 표현을 효과적으로 학습하고 제한적인 데이터에서도 우수한 성능을 달성할 수 있다.
Abstract
이 연구는 중국어 문자 표현 학습의 한계를 극복하기 위해 Formation Tree 기반 접근법을 제안한다. 중국어 문자는 구성 요소인 부수들의 위치 관계에 따라 다양한 형태로 구성되는데, 기존 방식은 이러한 계층적 구조를 충분히 활용하지 못했다.
제안하는 Formation Tree는 부수들의 위치 관계를 트리 구조로 표현하여 중국어 문자의 특성을 효과적으로 반영한다. 이를 위해 Formation Tree Transformer라는 전용 인코더를 개발하였으며, 부수 간 관계와 공간적 위치 정보를 활용하는 두 가지 인코딩 방식을 제안하였다.
또한 이미지와 트리 구조에 대한 마스킹 기법을 도입하여 학습 효율을 높이고 성능을 향상시켰다. 실험 결과, 제안 모델은 기존 방식 대비 월등한 성능을 보였으며, 특히 희귀 문자 인식에서 큰 성능 향상을 달성하였다. 이는 Formation Tree가 중국어 문자의 특성을 효과적으로 반영하여 일반화 능력을 높였기 때문으로 분석된다.
Stats
중국어 문자 데이터셋 CASIA-HWDB와 ICDAR2013을 활용하여 실험을 진행하였다.
희귀 문자 인식 실험에서 제안 모델은 기존 최고 성능 대비 약 5%p 이상 향상된 성능을 보였다.
기존 최고 성능 모델 대비 추론 속도가 약 10배 이상 빨랐다.
Quotes
"Formation Tree를 활용하여 중국어 문자의 계층적 구조를 효과적으로 반영함으로써 일반화 능력을 크게 향상시킬 수 있었다."
"마스킹 기법을 통해 학습 효율을 높이고 성능을 향상시킬 수 있었다."