이 논문은 조기 근대 활판 인쇄 도서의 물리적 인쇄 과정을 자동으로 분석하기 위한 새로운 계산 방법을 제안한다. 구체적으로 스캔된 문서의 실행 제목에 대한 시각적 유사성을 계산하기 위한 맞춤형 신경망 및 특징 기반 커널을 설계하고 비교한다. 이를 통해 책의 인쇄 과정에서 예상되는 패턴의 편차를 추적할 수 있다.
본문 텍스트는 매 페이지마다 재설정되어야 하지만, 실행 제목은 책 인쇄 시 재사용되는 정적 타입 요소 중 하나이다. 이러한 실행 제목의 클러스터링을 통해 검열과 같은 텍스트 전달 현상을 이해할 수 있다.
연구진은 8개의 조기 근대 도서에 걸쳐 약 1,600페이지의 실행 제목을 수동으로 주석 처리하여 평가 데이터셋을 구축했다. 제안 방법은 무작위 기준선보다 우수한 성능을 보였으며, 특히 도메인 지식을 활용한 편집 거리 기반 접근법이 강력한 비전 변환기 기반 교차 인코더 접근법보다 효과적인 것으로 나타났다. 또한 토마스 홉스의 리바이어던 인쇄에 대한 최근 수동 연구와 비교 분석을 수행했다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Nikolai Vogl... at arxiv.org 05-03-2024
https://arxiv.org/pdf/2405.00752.pdfDeeper Inquiries