핵심 개념
대규모 언어 모델(LLM)은 기존의 필기 텍스트 인식(HTR) 소프트웨어보다 빠르고 비용 효율적이면서도, 역사적 필기 문서를 훨씬 더 정확하게 전사할 수 있다.
초록
대규모 언어 모델을 활용한 역사 문서 전사: 정확도 및 효율성 향상
본 연구 논문에서는 대규모 언어 모델(LLM)이 기존의 HTR 소프트웨어보다 역사적 필기 문서를 전사하는 데 있어 정확성, 속도 및 비용 효율성 측면에서 뛰어난 성능을 보인다는 것을 입증한다.
본 연구는 상용으로 제공되는 LLM을 사용하여 18세기/19세기 영어 필기 문서의 대량 전사 작업에서 정확성, 속도 및 비용 효율성을 평가하는 것을 목표로 한다.
본 연구에서는 Transcription Pearl이라는 오픈 소스 소프트웨어 도구를 개발하여 OpenAI, Anthropic, Google의 상용 멀티모달 LLM을 사용하여 필기 문서를 자동으로 전사하고 수정한다. 18세기/19세기 영어 필기 문서 코퍼스에서 테스트를 수행하여 LLM의 성능을 Transkribus와 같은 기존 HTR 소프트웨어와 비교 분석한다. 문자 오류율(CER) 및 단어 오류율(WER)을 사용하여 정확성을 측정하고, 처리 시간 및 비용을 기록하여 효율성을 평가한다.