Core Concepts
데이터 공간 추상화를 통해 기존 프로토타입 선택 알고리즘의 실행 시간을 단축하면서도 분류 정확도와 데이터 축소율을 유지할 수 있는 효율적인 접근법을 제안한다.
Abstract
이 논문은 기존 프로토타입 선택 알고리즘의 실행 시간을 단축하기 위한 PSASA(Prototype Selection Accelerator based on Spatial Abstraction) 알고리즘을 제안한다.
PSASA 알고리즘은 다음과 같은 두 단계로 구성된다:
데이터셋을 공간 파티션으로 분할한다.
각 공간 파티션 내의 각 클래스에 대해 프로토타입을 생성한다.
이렇게 생성된 프로토타입 집합은 기존 프로토타입 선택 알고리즘의 입력으로 사용될 수 있다. 이를 통해 기존 알고리즘의 실행 시간을 단축할 수 있다.
실험 결과, PSASA 알고리즘을 적용한 프로토타입 선택 알고리즘은 기존 알고리즘과 비교하여 유사한 분류 정확도와 데이터 축소율을 달성하면서도 실행 시간을 크게 단축할 수 있음을 보여준다. 또한 PSASA 알고리즘의 핵심 매개변수인 n의 값에 따라 정확도, 축소율, 실행 시간 간의 trade-off를 조절할 수 있다.
Stats
데이터셋의 크기가 클수록 PSASA 알고리즘을 적용한 프로토타입 선택 알고리즘의 실행 시간이 크게 단축된다.
클래스 수가 적은 데이터셋에서 PSASA 알고리즘의 실행 시간 단축 효과가 더 크게 나타난다.
Quotes
"데이터 공간 추상화를 통해 기존 프로토타입 선택 알고리즘의 실행 시간을 단축하면서도 분류 정확도와 데이터 축소율을 유지할 수 있는 효율적인 접근법을 제안한다."
"실험 결과, PSASA 알고리즘을 적용한 프로토타입 선택 알고리즘은 기존 알고리즘과 비교하여 유사한 분류 정확도와 데이터 축소율을 달성하면서도 실행 시간을 크게 단축할 수 있음을 보여준다."