Core Concepts
Mathlib4의 정형화된 정리 문장을 비정형 문장으로 변환하고, 이를 활용하여 사용자의 비정형 질의에 대한 관련 정리를 효과적으로 검색할 수 있는 의미 기반 검색 엔진을 개발하였다.
Abstract
본 연구에서는 Mathlib4의 정형화된 정리 문장을 비정형 문장으로 변환하고, 이를 활용하여 사용자의 비정형 질의에 대한 관련 정리를 효과적으로 검색할 수 있는 의미 기반 검색 엔진을 개발하였다.
먼저, Mathlib4의 정리 문장을 대규모 언어 모델을 활용하여 비정형 문장으로 변환하였다. 이때 정리 문장의 정의 및 설명 등 추가 정보를 활용하여 변환의 정확성을 높였다.
다음으로, 변환된 비정형-정형 정리 쌍을 벡터 데이터베이스에 저장하였다. 사용자 질의 또한 비정형화하고 벡터화하여, 데이터베이스와의 유사도 검색을 통해 관련 정리를 찾아낸다.
이를 위해 질의 확장 기법을 활용하여 질의의 문맥을 풍부하게 만들었으며, 문서와 질의에 적절한 태스크 지침을 제공하여 임베딩 모델의 성능을 향상시켰다.
또한 Mathlib4 의미 기반 검색 벤치마크를 구축하여, 다양한 검색 방법론의 성능을 체계적으로 평가할 수 있도록 하였다. 실험 결과, 제안한 방법론이 기존 접근법에 비해 우수한 성능을 보임을 확인하였다.
Stats
정리 문장의 차수와 집합의 크기 사이의 관계:
Polynomial.degree (P * Q) = Polynomial.degree P + Polynomial.degree Q
집합 A와 B 사이에 서로 단사 사상이 존재하면 A와 B 사이에 전단사 사상이 존재한다:
{f : A → B} {g : B → A} (hf : Injective f) (hg : Injective g) : ∃ h, Bijective h
Quotes
"If there exist injective maps of sets from A to B and from B to A, then there exists a bijective map between A and B."
"If p implies q, then not q implies not p."