Główne pojęcia
비지도 학습 기반의 하이브리드 클러스터링 모델을 활용하여 고압 산업용 압축기의 예측 유지보수 전략을 개선하고, 이를 통해 고장 감지 정확도를 향상시키고 학습 시간을 단축할 수 있다.
Streszczenie
고압 산업용 압축기의 예측 유지보수 연구: 하이브리드 클러스터링 모델 적용
본 연구는 센서 데이터와 비지도 학습 클러스터링에서 추출한 특징을 활용하여 고압 산업용 압축기의 예측 유지보수 전략을 개선하고, 압축기 고장 감지 모델의 정확성 및 효율성을 향상시키는 것을 목표로 한다.
데이터 전처리: 8개월간 수집된 압축기 운영 데이터(675,660개 관측값, 37개 특징)에서 누락된 데이터를 제거하고, 자기 상관 행렬을 계산하여 상관관계가 높은 특징을 제거한다. 이후 ANOVA 분석을 통해 통계적으로 유의미한 특징을 선택한다.
클러스터링 파라미터 최적화: 데이터셋을 10%, 20%, 30% 크기로 나누어 K-Means 및 HDBSCAN 알고리즘의 최적 epsilon 및 클러스터 수 (ncluster) 값을 결정한다. Nearest Neighbors 그래프의 최대 곡률 지점 분석 및 Silhouette 함수 메트릭을 활용한다.
클러스터링 및 평가: 최적화된 파라미터를 사용하여 K-Means, HDBSCAN, OPTICS, BIRCH, GMM, MS-AMS 등 다양한 클러스터링 알고리즘을 적용한다. 각 알고리즘의 성능을 시각적으로 비교하고, ARI 및 NMI 메트릭을 사용하여 클러스터 품질을 평가한다.
분류 모델 적용: 클러스터링 단계에서 얻은 특징을 추가하여 Logistic Regression, SVC, GaussianNB, GradientBoostingClassifier, KNeighborsClassifier, RandomForestClassifier 등 다양한 분류 모델을 학습한다.
교차 검증 및 성능 비교: 클러스터링 특징 추가 유무에 따른 각 모델의 정확도, Recall, F1-score, False Positives (FP), False Negatives (FN) 및 학습 시간을 비교 분석한다.