본 논문에서는 강화 학습 기반 솔루션을 통해 신경망 구조 탐색 문제를 해결하는 능력을 평가합니다. 강화 학습 에이전트가 단일 최적의 구조를 반환하는 것이 아니라 좋은 구조를 탐색하는 방법을 학습합니다.
두 개의 일정한 공유 가중치 초기화를 통해 신경망 구조의 잠재력을 평가할 수 있다.