แนวคิดหลัก
고급 언어 모델(LLM)의 발전으로 프롬프트 엔지니어링 기술의 효과가 감소하고 있으며, 특히 추론 능력이 향상된 모델의 경우 간단한 프롬프트만으로도 우수한 성능을 달성할 수 있다.
บทคัดย่อ
고급 언어 모델과 프롬프트 엔지니어링: 소프트웨어 엔지니어링에서의 효과 재검토
본 연구 논문은 고급 언어 모델(LLM)이 소프트웨어 엔지니어링 작업에서 프롬프트 엔지니어링의 필요성을 감소시키는지에 대한 실증적인 연구 결과를 제시합니다. 특히 GPT-4o와 같은 비추론 모델과 o1-mini와 같은 추론 모델을 사용하여 코드 생성, 코드 번역, 코드 요약의 세 가지 소프트웨어 엔지니어링 작업에서 다양한 프롬프트 엔지니어링 기술의 효과를 비교 분석합니다.
본 연구는 최신 LLM을 활용한 소프트웨어 엔지니어링 작업에서 기존 프롬프트 엔지니어링 기술의 효과를 재평가하고, 추론 모델과 비추론 모델의 실질적인 성능 차이를 비교 분석하는 것을 목표로 합니다. 또한, 고급 LLM 사용에 따른 비용 효율성을 분석하여 실무자에게 적합한 프롬프트 엔지니어링 기술 및 LLM 선택에 대한 지침을 제공하고자 합니다.
본 연구에서는 코드 생성, 코드 번역, 코드 요약 작업에 대해 각각 HumanEval, CodeTrans, CodeSearchNet 데이터셋을 사용하여 실험을 진행했습니다. 각 작업별로 최신 프롬프트 엔지니어링 기술을 활용한 여러 접근 방식을 선정하고, GPT-4o 및 o1-mini 모델을 적용하여 성능을 비교 분석했습니다. 성능 지표로는 코드 생성 작업의 경우 pass@k, 코드 번역 작업의 경우 CA(Computational Accuracy), 코드 요약 작업의 경우 GPT 기반 평가 방법을 사용했습니다.