본 연구는 대규모 언어 모델(LLM)을 사용하여 MUMPS 및 ALC와 같은 레거시 프로그래밍 언어로 작성된 코드에 대한 문서를 자동으로 생성하는 것의 효과를 탐구하고, 자동화된 평가 지표가 인간 전문가의 평가와 일치하지 않는다는 것을 발견했습니다.