Kernkonzepte
이더리움 플랫폼에서 금융 봇을 탐지하기 위한 기계 학습 기반 접근법을 제안한다. 봇 행동에 대한 분류 체계를 수립하고, 라벨링된 데이터셋을 구축하여 비지도 및 지도 학습 모델을 평가한다. 가장 영향력 있는 특징을 식별하여 봇 탐지 모델의 성능을 향상시킨다.
Zusammenfassung
이 연구는 이더리움 플랫폼에서 활동하는 금융 봇의 유형을 체계화하고, 기계 학습 기반 탐지 방법을 제안한다.
- 금융 봇 행동에 대한 분류 체계 수립
- 문헌 조사와 실증적 증거를 바탕으로 7개 범주와 24개 하위 범주로 구성된 금융 봇 분류 체계를 제안
- 라벨링된 데이터셋 구축
- 133개 인간 계정과 137개 봇 계정으로 구성된 바이너리 데이터셋 생성
- 추가로 111개 각 MEV 봇 유형(Arbitrage, Sandwich, Liquidation)과 111개 non-MEV 계정으로 구성된 다중 클래스 데이터셋 생성
- 비지도 및 지도 학습 모델 평가
- 비지도 학습 모델인 Gaussian Mixture Model이 82.6%의 가장 높은 클러스터 순도를 달성
- 지도 학습 모델 중 Random Forest가 83%의 가장 높은 정확도를 보임
- 중요 특징 식별
- SHAP 값 분석을 통해 거래 시간, 빈도, 가스 가격, 가스 한도 관련 특징이 가장 영향력 있음을 확인
이 연구는 이더리움 생태계 역학을 이해하는 데 도움이 되며, 금융 봇의 현황과 영향을 모니터링하는 데 기여할 수 있다.
Statistiken
거래 당 평균 가스 가격이 높을수록 봇일 가능성이 높다.
거래 당 평균 가스 한도가 높을수록 청산 봇일 가능성이 높다.
이더 전송량의 표준편차가 높을수록 샌드위치 봇일 가능성이 높다.