核心概念
Tsetlin 기계의 정확도, 학습 시간 및 추론 시간을 개선하기 위해 데이터셋을 사전에 정렬하는 방법을 제안합니다.
摘要
이 논문은 Tsetlin 기계의 성능을 향상시키기 위한 사전 정렬 아키텍처를 제안합니다. 주요 내용은 다음과 같습니다:
유전 알고리즘을 사용하여 데이터셋에서 N개의 최대 분산 데이터 포인트를 식별합니다.
K-Medoid 클러스터링 알고리즘을 사용하여 동일한 클래스의 데이터 포인트를 N개의 클러스터로 정렬합니다.
유전 알고리즘을 사용하여 N개의 독립적인 Tsetlin 기계에 클러스터를 정렬합니다.
MNIST 수준의 분류 문제에서 정확도는 최대 10% 향상되었고, 학습 시간은 약 383배, 추론 시간은 약 86배 단축되었습니다.
하드웨어 측면에서 Tsetlin 기계와 사전 정렬 아키텍처의 시너지 효과를 논의합니다.
統計資料
FMNIST 데이터셋에서 베이스라인 Tsetlin 기계의 정확도는 89.50%이고, 사전 정렬 Tsetlin 기계의 정확도는 99.81%로 10.32% 향상되었습니다.
KMNIST 데이터셋에서 베이스라인 Tsetlin 기계의 정확도는 96.07%이고, 사전 정렬 Tsetlin 기계의 정확도는 99.50%로 3.43% 향상되었습니다.
EMNIST 데이터셋에서 베이스라인 Tsetlin 기계의 정확도는 98.45%이고, 사전 정렬 Tsetlin 기계의 정확도는 99.86%로 1.41% 향상되었습니다.
MNIST 데이터셋에서 베이스라인 Tsetlin 기계의 정확도는 97.88%이고, 사전 정렬 Tsetlin 기계의 정확도는 99.86%로 1.98% 향상되었습니다.