핵심 개념
COSTREAM은 엣지-클라우드 환경에서 스트리밍 쿼리의 실행 비용을 정확하게 예측할 수 있는 새로운 학습 기반 비용 모델이다. 이를 통해 이기종 하드웨어 자원에 걸쳐 연산자를 최적으로 배치할 수 있다.
초록
이 논문은 COSTREAM이라는 새로운 학습 기반 비용 모델을 소개한다. COSTREAM은 엣지-클라우드 환경에서 스트리밍 쿼리의 실행 비용을 정확하게 예측할 수 있다.
주요 내용은 다음과 같다:
연산자, 데이터 스트림, 하드웨어 자원을 통합적으로 표현하는 새로운 그래프 기반 모델을 제안한다. 이를 통해 복잡한 상호작용을 학습할 수 있다.
하드웨어 및 쿼리 특성에 대한 일반화된 특징을 선별하여, 학습된 모델이 보지 못한 환경에서도 정확한 비용 예측이 가능하도록 한다.
비용 예측 모델을 활용하여 초기 연산자 배치 문제를 해결하는 방법을 제안한다. 실험 결과, COSTREAM을 사용하면 기존 방식 대비 약 21배 빠른 성능 향상을 달성할 수 있다.
통계
하드웨어 자원 중 CPU 사용률이 50%에서 800%까지 다양하게 변화한다.
메모리 용량은 1GB에서 32GB까지 다양하다.
네트워크 대역폭은 25Mbps에서 10Gbps까지, 지연 시간은 1ms에서 160ms까지 변화한다.
데이터 스트림의 초당 이벤트 수는 100개에서 25,600개까지 다양하다.
인용구
"COSTREAM은 엣지-클라우드 환경에서 스트리밍 쿼리의 실행 비용을 정확하게 예측할 수 있는 새로운 학습 기반 비용 모델이다."
"COSTREAM을 사용하면 기존 방식 대비 약 21배 빠른 성능 향상을 달성할 수 있다."