Core Concepts
신경망 구조 탐색(NAS) 기법은 전문가의 개입 없이도 최적의 신경망 구조를 자동으로 찾아낼 수 있다. 그러나 기존 NAS 연구는 제한된 데이터셋에 초점을 맞추어 왔으며, 이는 실제 문제에 적용하기 어려운 한계가 있다. 본 연구에서는 다양한 유형의 새로운 데이터셋을 소개하여 NAS 기법의 일반화 능력을 평가하고자 한다.
Abstract
본 연구는 신경망 구조 탐색(NAS) 기법의 일반화 능력을 평가하기 위해 새로운 데이터셋을 소개한다. 기존 NAS 연구는 CIFAR-10, ImageNet 등 제한된 데이터셋에 초점을 맞추어 왔으며, 이는 실제 문제에 적용하기 어려운 한계가 있다.
본 연구에서는 다음과 같은 8개의 새로운 데이터셋을 소개한다:
- AddNIST: MNIST 데이터를 활용하여 생성한 3채널 이미지 데이터셋. 각 채널의 MNIST 숫자를 더한 값이 클래스 레이블이 된다.
- Language: 10개 언어의 6자리 단어를 이미지로 인코딩한 데이터셋. 언어를 구분하는 것이 과제이다.
- MultNIST: MNIST 데이터를 활용하여 생성한 3채널 이미지 데이터셋. 각 채널의 MNIST 숫자를 곱한 값을 클래스 레이블로 사용한다.
- CIFARTile: CIFAR-10 이미지 4개를 타일링한 이미지 데이터셋. 고유한 클래스 레이블을 가진다.
- Gutenberg: 6명의 저자의 작품에서 추출한 단어 시퀀스를 이미지로 인코딩한 데이터셋. 저자를 구분하는 것이 과제이다.
- Isabella: 4개 시대의 음악 녹음을 5초 단위로 분할한 스펙트로그램 데이터셋. 음악 시대를 구분하는 것이 과제이다.
- GeoClassing: 유럽 위성 사진 데이터셋. 사진이 찍힌 국가를 구분하는 것이 과제이다.
- Chesseract: 체스 게임 마지막 15% 보드 상태를 이미지로 인코딩한 데이터셋. 게임 결과(흰색 승, 무승부, 검은색 승)를 구분하는 것이 과제이다.
이러한 새로운 데이터셋은 NAS 기법의 일반화 능력을 평가하고 실제 문제에 적용할 수 있는 NAS 기법 개발을 촉진할 것으로 기대된다.
Stats
AddNIST 데이터셋의 ResNet-18 정확도는 92.08%이다.
Language 데이터셋의 ResNeXt 정확도는 93.97%이다.
MultNIST 데이터셋의 AlexNet 정확도는 94.01%이다.
CIFARTile 데이터셋의 DenseNet 정확도는 51.28%이다.
Gutenberg 데이터셋의 AlexNet 정확도는 45.53%이다.
Isabella 데이터셋의 DenseNet 정확도는 63.27%이다.
GeoClassing 데이터셋의 DenseNet 정확도는 94.21%이다.
Chesseract 데이터셋의 DenseNet 정확도는 59.60%이다.