이 논문은 새로운 로그 기반 학습률 스케줄링 방법인 순환 로그 어닐링을 소개한다. 기존의 코사인 어닐링과 유사하게 학습률을 주기적으로 재시작하지만, 로그 함수를 사용하여 더 공격적인 재시작 패턴을 구현한다. 이를 통해 온라인 볼록 최적화 프레임워크에서 더 탐욕적인 알고리즘을 사용할 수 있게 한다.
실험 결과, 순환 로그 어닐링은 CIFAR-10 이미지 분류 문제에서 대규모 트랜스포머 강화 잔차 신경망 모델의 성능을 코사인 어닐링과 유사하게 달성했다. 특히 초기 학습 단계에서 순환 로그 어닐링의 성능이 더 좋았다. 이는 순환 로그 어닐링이 국소 최소값에서 벗어나는 데 효과적일 수 있음을 시사한다.
향후 연구에서는 순환 로그 어닐링의 다양한 매개변수를 실험하여 최적의 조합을 찾고, 생성적 적대 신경망과 같은 다른 모델에서의 성능을 평가할 계획이다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문