이 논문은 인쇄된 수학 수식 인식(MER) 모델의 성능 향상을 위한 데이터 중심 접근법을 제안한다. 기존 MER 모델들은 LaTeX 생성 수학 수식을 입력으로 사용하고 LaTeX 소스 코드를 정답으로 사용하였는데, 이로 인해 정답 데이터에 원치 않는 변동성이 발생하여 모델 성능 향상을 저해하였다. 또한 단일 폰트로 수식을 생성하여 실제 상황에 대한 일반화 성능이 제한적이었다.
이를 해결하기 위해 저자들은 다음과 같은 기여를 하였다:
실험 결과, 제안한 데이터 중심 접근법과 MathNet 모델이 기존 최고 성능 대비 오류율을 최대 88.3% 감소시킬 수 있음을 보였다. 이는 데이터 정규화와 다양한 폰트 사용이 MER 모델 성능 향상에 매우 효과적임을 시사한다.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Felix M. Sch... lúc arxiv.org 04-23-2024
https://arxiv.org/pdf/2404.13667.pdfYêu cầu sâu hơn