Core Concepts
RanLayNet 데이터셋은 다양한 문서 레이아웃을 포함하여 모델의 적응성과 일반화 능력을 향상시킬 수 있다.
Abstract
이 연구에서는 RanLayNet이라는 새로운 합성 문서 데이터셋을 소개했습니다. RanLayNet은 자동으로 할당된 레이블로 공간 위치, 범위 및 레이아웃 요소 유형을 나타냅니다. 이 데이터셋의 주요 목적은 다양한 문서 형식에 강건하고 적응력 있는 모델을 훈련시킬 수 있는 다양한 데이터셋을 개발하는 것입니다.
실험을 통해 RanLayNet 데이터셋으로 훈련된 딥 레이아웃 식별 모델이 실제 문서로만 훈련된 모델보다 향상된 성능을 보였습니다. 또한 PubLayNet과 IIIT-AR-13K 데이터셋을 사용하여 fine-tuning한 모델과 비교 분석을 수행했습니다. 그 결과 RanLayNet 데이터셋으로 강화된 모델이 과학 문서 도메인의 TABLE 클래스에서 0.398 및 0.588의 mAP95 점수를 달성하여 최적의 성능을 보였습니다.
Stats
과학 문서 도메인의 TABLE 클래스에서 RanLayNet 데이터셋으로 fine-tuning한 모델이 0.398의 mAP95 점수를 달성했습니다.
과학 문서 도메인의 TABLE 클래스에서 PubLayNet 데이터셋으로 fine-tuning한 모델이 0.588의 mAP95 점수를 달성했습니다.
Quotes
"RanLayNet 데이터셋은 다양한 레이아웃 구조를 도입하여 기존 데이터셋을 능가하는 복잡한 구조를 제공합니다."
"RanLayNet으로 훈련된 모델은 실제 문서로 훈련된 모델보다 우수한 성능을 보였습니다."