대규모 언어 모델을 활용하여 다양한 수준의 코드 문서화를 생성하고, 이를 사람이 작성한 원본 문서화와 비교 분석하였다. 폐쇄형 모델인 GPT-3.5, GPT-4, Bard가 대체로 우수한 성능을 보였으며, 오픈소스 모델인 LLama2와 StarChat은 상대적으로 낮은 성과를 나타냈다.