Core Concepts
다양한 방식으로 선택된 학습 데이터 세트가 자동화된 알고리즘 선택 모델의 성능에 미치는 영향을 분석하였다. 학습 데이터 세트의 분포가 테스트 데이터 세트와 일치할수록 모델 성능이 향상되며, 학습 데이터 세트 크기를 늘리면 분포 불일치 문제를 완화할 수 있다.
Abstract
이 연구는 MA-BBOB 함수 생성기를 활용하여 자동화된 알고리즘 선택 모델의 성능에 대한 학습 데이터 선택 방식의 영향을 분석하였다.
MA-BBOB 함수 생성기를 사용하여 2차원과 5차원 문제 11,920개를 생성하고, 8개 최적화 알고리즘의 성능 데이터를 수집하였다.
29개의 탐색적 경관 특징을 계산하고, 이를 바탕으로 알고리즘 선택 모델을 구축하였다.
학습 데이터 선택 방식으로 무작위 선택, 다양성 기반 선택, BBOB 함수 사용 등 3가지 방식을 비교하였다.
학습 데이터 세트의 분포가 테스트 데이터 세트와 일치할수록 모델 성능이 향상되며, 학습 데이터 세트 크기를 늘리면 분포 불일치 문제를 완화할 수 있다.
BBOB 함수만을 사용한 학습 데이터 세트는 일반화 성능이 좋지 않았다.
Stats
최적화 알고리즘 중 modCMA가 가장 우수한 평균 성능을 보였다.
8개 알고리즘 포트폴리오에서 modCMA를 제외한 7개 알고리즘을 사용할 경우 가장 큰 성능 보완성을 보였다.
Quotes
"학습 데이터 세트의 분포가 테스트 데이터 세트와 일치할수록 모델 성능이 향상된다."
"학습 데이터 세트 크기를 늘리면 분포 불일치 문제를 완화할 수 있다."
"BBOB 함수만을 사용한 학습 데이터 세트는 일반화 성능이 좋지 않았다."