Główne pojęcia
FSD-Inference는 확장 가능하고 비용 효율적인 완전 무서버 분산 딥러닝 추론 시스템을 제공한다. 이를 위해 클라우드 기반 발행-구독/큐 및 객체 스토리지 서비스를 활용한 새로운 무서버 통신 메커니즘을 도입하였다.
Streszczenie
이 논문은 FSD-Inference, 완전 무서버 확장 가능 분산 딥러닝 추론 시스템을 소개한다.
FSD-Inference는 다음과 같은 핵심 특징을 가진다:
- 완전 무서버 통신 메커니즘: 클라우드 기반 발행-구독/큐 및 객체 스토리지 서비스를 활용하여 함수 간 통신을 구현
- 계층 내 모델 병렬화: 제한된 메모리의 FaaS 인스턴스에서 대규모 모델을 처리하기 위해 모델을 분할하고 병렬로 실행
- 효율적인 함수 실행 트리: 계층적 함수 실행 메커니즘을 통해 시작 지연을 최소화하고 각 함수가 자신의 위치를 자동으로 결정할 수 있도록 함
- 비용 모델 및 최적화: 다양한 워크로드에 대한 비용 모델을 제시하고 통신 채널 선택, 압축, 파티셔닝 등의 최적화를 통해 비용 효율성 제고
실험 결과, FSD-Inference는 기존 서버 기반 솔루션 대비 비용 효율성과 확장성이 크게 향상되었으며, 최적화된 HPC 솔루션과도 경쟁력 있는 성능을 보였다.
Statystyki
클라우드 제공업체가 제한한 FaaS 인스턴스의 메모리, CPU, 런타임 시간으로 인해 데이터 집약적 애플리케이션과 기계 학습 워크로드에 대한 FaaS 활용이 제한되어 왔다.
전통적인 '서버 기반' 플랫폼은 빠른 네트워크와 MPI, 공유 메모리 등의 프로세스 간 통신 메커니즘을 통해 분산 계산을 가능하게 한다.
그러나 무서버 도메인에서는 이러한 솔루션이 부재하여 상당한 프로세스 간 통신 요구사항을 가진 병렬 계산이 어려운 상황이다.
Cytaty
"FSD-Inference는 완전 무서버이며 매우 확장 가능한 분산 기계 학습 추론 시스템이다."
"우리는 FaaS 컴퓨팅 내에서 기계 학습 추론 워크로드를 위한 완전 무서버 통신 체계를 소개한다."