이 논문에서는 깊은 신경망을 학습하기 위한 확률적 경사 기반 접근법에서 하이퍼파라미터 최적화를 위한 크로스 엔트로피 최적화 방법을 제시한다.
하이퍼파라미터는 학습 과정을 제어하는 데 사용되며, 수렴 속도, 일반화 성능 등 모델 성능에 큰 영향을 미친다. 일부 경우 하이퍼파라미터가 학습 매개변수의 일부가 될 수 있지만, 다른 경우에는 Adam 등의 확률적 최적화 알고리즘의 하이퍼파라미터가 고정값이거나 단조적으로 변화한다.
제안된 크로스 엔트로피 최적화 방법(CEHPO)은 하이퍼파라미터 공간에 대한 확률 분포를 사용하여 희귀 이벤트 시뮬레이션 기술을 활용해 최적의 하이퍼파라미터 값을 찾는다. 이 방법은 기존 하이퍼파라미터 최적화 방법과 달리 확률 분포 업데이트를 통해 전역 최적화를 수행한다.
CEHPO 알고리즘은 다양한 데이터셋과 기계 학습 문제에 적용될 수 있으며, 기계 학습 및 그 이상의 다양한 분야에서 최적화 문제에 대한 새로운 관점과 통찰을 제공할 것으로 기대된다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania