核心概念
대규모 언어 모델 기반 에이전트가 데이터 과학 작업을 자동화하기 위해 과제 요구사항을 이해하고 최적의 기계 학습 모델을 구축 및 학습할 수 있도록 하는 방법을 제시한다.
摘要
이 논문은 대규모 언어 모델(LLM) 기반 에이전트가 데이터 과학 작업을 자동화할 수 있는 방법을 제안한다. 기존 LLM 에이전트는 합리적인 실험 계획을 생성하는 데 어려움을 겪어 작업 완료율이 낮았다. 이를 해결하기 위해 저자들은 DS-Agent라는 새로운 자동화 프레임워크를 제안한다.
DS-Agent는 두 단계로 구성된다:
- 개발 단계: DS-Agent는 사례 기반 추론(CBR) 프레임워크를 기반으로 자동화된 반복 파이프라인을 따른다. 이를 통해 Kaggle의 전문가 지식을 활용하여 실험 계획을 개발하고, 실행 피드백을 바탕으로 지속적으로 개선한다.
- 배포 단계: DS-Agent는 간소화된 CBR 프레임워크를 사용하여 개발 단계에서 수집한 성공적인 사례를 재사용하여 코드를 생성한다. 이를 통해 LLM의 기본 기능에 대한 요구사항을 크게 줄일 수 있다.
실험 결과, DS-Agent는 개발 단계에서 GPT-4를 사용할 때 100%의 성공률을 달성했으며, 배포 단계에서도 GPT-3.5와 GPT-4를 사용할 때 각각 85%와 99%의 높은 one-pass 비율을 보였다. 또한 DS-Agent는 배포 단계에서 기존 방법 대비 자원 비용을 90% 이상 절감할 수 있었다.
統計資料
DS-Agent는 개발 단계에서 GPT-4를 사용할 때 12개의 데이터 과학 과제 중 100%의 성공률을 달성했다.
DS-Agent는 배포 단계에서 GPT-3.5와 GPT-4를 사용할 때 각각 18개의 과제 중 85%와 99%의 one-pass 비율을 보였다.
DS-Agent는 배포 단계에서 GPT-3.5와 GPT-4를 사용할 때 각각 기존 방법 대비 92.5%와 91.5%의 자원 비용 절감 효과를 보였다.
引述
"DS-Agent는 개발 단계에서 GPT-4를 사용할 때 12개의 데이터 과학 과제 중 100%의 성공률을 달성했다."
"DS-Agent는 배포 단계에서 GPT-3.5와 GPT-4를 사용할 때 각각 18개의 과제 중 85%와 99%의 one-pass 비율을 보였다."
"DS-Agent는 배포 단계에서 GPT-3.5와 GPT-4를 사용할 때 각각 기존 방법 대비 92.5%와 91.5%의 자원 비용 절감 효과를 보였다."