데이터 주장의 진실성을 확인하고 데이터 증거를 효과적으로 전달하는 자동화된 시스템을 개발하는 것이 이 연구의 핵심 목표이다.
데이터 과학 에이전트의 성능을 평가하기 위해 DSBench라는 종합적인 벤치마크를 소개한다. DSBench는 현실 세계의 데이터 과학 과제를 반영하는 466개의 데이터 분석 과제와 74개의 데이터 모델링 과제로 구성되어 있다. 최신 LLM과 LVLM 모델들이 이 벤치마크에서 대부분의 과제를 해결하지 못하는 것으로 나타났으며, 가장 우수한 에이전트도 데이터 분석 과제의 34.12%만 해결하고 데이터 모델링 과제에서 34.74%의 상대적 성능 격차를 보였다. 이는 데이터 과학 에이전트의 실용성, 지능성, 자율성을 높이기 위한 추가적인 발전이 필요함을 시사한다.
대규모 언어 모델(GPT-3.5)을 활용하여 다양한 벤치마크 데이터셋에 대한 데이터 과학 과제를 수행할 수 있음을 입증하였다.
대형 언어 모델(LLM)을 활용하여 테이블 데이터의 분류, 회귀 및 결측값 보완 작업을 수행하고자 한다. LLM은 자연어 이해에 능숙하지만 구조화된 테이블 데이터 처리에는 한계가 있다. 이를 해결하기 위해 다양한 테이블 데이터로 LLM을 대규모 학습시키고, 이를 통해 테이블 데이터 이해와 자연어 이해의 장점을 결합하여 테이블 데이터 예측 작업을 향상시키고자 한다.
이 연구는 대규모 속성 그래프에서 노드, 엣지, 경로 가설을 정의하고 샘플링 기반 가설 검정 프레임워크를 제안합니다. 이를 위해 경로 가설 인식 샘플러 PHASE와 이의 최적화 버전 PHASEopt를 개발하여 정확성과 효율성을 높였습니다.
대규모 언어 모델(LLM)은 자연어 프롬프트에서 코드를 생성할 수 있지만, 실제 세계에서는 입출력 사양이 필요하여 LLM의 출력이 사용자의 의도와 일치하지 않는 문제가 있다. 이 연구는 데이터 과학 프로그래밍 도메인에서 입출력 사양을 활용하여 LLM의 코드 생성 성능을 향상시키는 방법을 제안한다.
컴퓨테이셔널 노트북에서 프레젠테이션 슬라이드를 생성하는 과정을 간소화하기 위해 아웃라인 기반의 접근법을 제안한다. 이를 통해 사용자가 슬라이드의 구조와 내용을 효과적으로 구상할 수 있도록 지원한다.
대규모 언어 모델 기반 에이전트가 데이터 과학 작업을 자동화하기 위해 과제 요구사항을 이해하고 최적의 기계 학습 모델을 구축 및 학습할 수 있도록 하는 방법을 제시한다.
UniTabE는 다양한 테이블 구조에 적용 가능한 범용 사전 학습 프로토콜을 제안하여, 테이블 데이터의 의미 표현을 크게 향상시킴.
데이터 과학자들이 데이터 표준화 작업을 간단하고 효율적으로 수행할 수 있도록 Dataprep.Clean 라이브러리와 LLM 기반 에이전트를 결합한 CleanAgent 프레임워크를 제안합니다.