이 연구는 파리와 주변 지역의 결혼 기록 300,000건을 포함하는 방대한 데이터베이스를 구축하는 EXO-POPP 프로젝트의 일환이다. 각 결혼 기록에는 최대 118개의 다양한 정보가 포함되어 있어, 이를 자동으로 추출하는 것이 큰 과제이다.
연구진은 M-POPP 데이터셋을 소개하였는데, 이는 전체 페이지 수준에서 필기체 및 인쇄체 문서의 텍스트 인식과 정보 추출을 위한 주석이 포함된 데이터셋이다. 또한 DAN 아키텍처를 개선하여 페이지 이미지에서 직접 텍스트 인식과 정보 추출을 수행하는 종단간 모델을 제안하였다. 이 모델은 Esposalles 데이터셋에서 새로운 최고 성능을 달성하였고, M-POPP 데이터셋에 대한 강력한 기준선을 제시하였다.
추가로 정보 추출 성능에 영향을 미치는 다양한 개체명 인코딩 방식을 비교 분석하였다. 결과적으로 계층적 정보를 단일 태그로 인코딩하는 방식이 가장 효과적인 것으로 나타났다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor