이 논문은 심볼릭 회귀(Symbolic Regression, SR) 문제에서 표현식의 복잡도를 줄이는 새로운 단순화 기법을 제안한다. SR은 데이터에 가장 잘 맞는 수학적 모델을 찾는 문제로, 모델의 단순성과 해석 가능성을 중요하게 고려한다.
제안하는 기법은 지역 민감 해싱(Locality-sensitive Hashing, LSH)을 활용하여 표현식의 동작이 유사한 서브트리를 효율적으로 찾아 단순화한다. 구체적으로:
이 단순화 기법을 유전 프로그래밍 기반의 SR 알고리즘에 통합하여 실험을 수행했다. 실험 결과, 단순화 기법을 적용한 경우 오차 성능이 향상되고 모델 복잡도가 감소했다. 특히 비선형 함수 사용이 줄어들어 모델의 해석 가능성이 높아졌다. 이는 제안한 기법이 일반적인 대수 법칙뿐만 아니라 문제 특화적인 단순화 규칙도 학습할 수 있음을 보여준다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문