Core Concepts
Coq 구문과 논리에 대한 인공지능 모델의 이해와 생성 능력을 향상시키기 위해 포괄적인 Coq 코드 데이터셋을 제공한다.
Abstract
이 연구는 Coq 증명 보조기 내에서 기계 학습과 인공지능의 통합을 발전시키고자 한다. 포괄적인 데이터셋을 개발함으로써 Coq 코드 처리와 생성에 대한 대형 언어 모델(LLM)의 역량을 향상시키는 것이 목표이다.
데이터셋은 Coq 코드 파일 10,000개 이상을 수집하여 구성되었다. 명제, 증명, 정의 등 다양한 Coq 구문을 포함하며, 각 항목에 대한 메타데이터(출처 참조, 라이선스 정보 등)도 제공한다.
실험 결과, 이 데이터셋으로 fine-tuning된 LLM 모델은 Coq 구문과 논리를 잘 이해하고 생성할 수 있었다. 특히 n = n + 0 명제에 대해 141개의 유효한 증명을 생성하는 등, LLM의 Coq 증명 생성 능력이 크게 향상되었음을 보여주었다.
이러한 성과는 LLM이 적절한 데이터셋으로 훈련되면 Coq 코드 생성과 이해에서 뛰어난 성능을 발휘할 수 있음을 시사한다. 향후 이 데이터셋을 활용하여 Coq 코드 생성을 자동화하고 증명 과정을 지원하는 에이전트 시스템 개발이 가능할 것으로 기대된다.
Stats
n = n + 0
7 + 3 = 10
S (m * n) = m * n + n
Quotes
"이 데이터셋으로 fine-tuning된 LLM 모델은 Coq 구문과 논리를 잘 이해하고 생성할 수 있었다."
"특히 n = n + 0 명제에 대해 141개의 유효한 증명을 생성하는 등, LLM의 Coq 증명 생성 능력이 크게 향상되었음을 보여주었다."