Core Concepts
3DGEN은 AI 에이전트를 활용하여 자연어 문서와 예제 입력으로부터 3D 언어로 된 형식 명세를 생성하고, 기호적 테스트 생성을 통해 생성된 명세를 검증하여 안전하고 효율적이며 검증 가능한 C 코드를 생성한다.
Abstract
3DGEN은 AI 에이전트를 활용하여 자연어 문서(RFC)와 예제 입력으로부터 3D 언어로 된 형식 명세를 생성한다. 3D는 바이너리 메시지 형식을 기술하기 위한 도메인 특화 언어로, 생성된 명세로부터 EverParse를 통해 메모리 안전성, 기능적 정확성, 이중 참조 자유 등을 보장하는 C 코드를 생성할 수 있다.
3DGEN의 핵심은 사용자의 비공식적 의도를 형식 명세로 반복적으로 정제하는 자동화된 프로세스이다. 이를 위해 3DGEN은 3D 언어 문서를 활용하여 AI 에이전트에게 3D 언어를 가르치고, 에이전트가 자연어 문서와 예제 입력으로부터 3D 명세를 생성하도록 한다. 생성된 명세는 3D 컴파일러와 새로 개발한 기호적 테스트 생성기 3DTESTGEN을 통해 검증되며, 테스트 결과를 바탕으로 에이전트가 명세를 반복적으로 개선한다.
3DGEN은 20개의 인터넷 표준 프로토콜 형식에 대해 평가되었으며, 이를 통해 AI 에이전트가 상당 규모의 검증 가능한 C 코드를 생성할 수 있음을 보여주었다. 특히 도메인 특화 언어를 중간 언어로 활용하는 것이 핵심 요인으로, 이를 통해 기호적 테스트 생성 및 차분 분석과 같은 강력한 자동화 도구를 활용할 수 있었다.
Stats
3DGEN은 20개의 인터넷 표준 프로토콜 형식에 대해 평가되었다.
3DGEN은 45%의 프로토콜에 대해 성공적으로 명세를 생성했다.
나머지 55%의 프로토콜에 대해서는 Wireshark가 RFC에 명시된 제약 조건을 적용하지 않아 3DGEN이 생성한 명세가 통과하지 못했다.
Quotes
"3DGEN은 AI 에이전트를 활용하여 자연어 문서와 예제 입력으로부터 3D 언어로 된 형식 명세를 생성한다."
"생성된 명세는 3D 컴파일러와 기호적 테스트 생성기 3DTESTGEN을 통해 검증되며, 테스트 결과를 바탕으로 에이전트가 명세를 반복적으로 개선한다."