다중 AI 에이전트 모델을 통해 GPT-3.5 Turbo, GPT-4, Google Bard 등 다양한 대규모 언어 모델의 코드 생성 성능을 평가하고 비교하였으며, GPT-3.5 Turbo가 가장 우수한 성능을 보였다.