이 연구는 Edge AI 환경에서 다양한 블랙박스 배포 연산자(분할, 양자화, 조기 종료)와 배포 계층(모바일, 엣지, 클라우드)의 조합이 지연 시간과 모델 성능 간의 최적의 균형을 달성하는 데 도움이 될 수 있는지 실험적으로 평가합니다.
주요 내용은 다음과 같습니다:
실험 결과, 엣지 계층에서 양자화와 조기 종료를 결합한 하이브리드 연산자가 빠른 지연 시간이 필요할 때 중간 수준의 정확도 손실로 선호될 수 있다. 그러나 정확도 손실을 최소화해야 하는 경우 MLOps 엔지니어는 엣지에서 양자화 연산자만 사용하는 것이 좋다. 모바일 CPU/RAM 리소스가 제한된 시나리오에서는 모바일-엣지 분할이 모바일 배포보다 선호된다. 입력 데이터 크기가 작은 모델(FCN)의 경우 클라우드 배포가 모바일/엣지 배포 및 분할 전략보다 더 나은 대안이 될 수 있다. 입력 데이터 크기가 큰 모델(ResNet, ResNext, DUC)의 경우 클라우드/모바일보다 더 높은 네트워크/계산 기능을 가진 엣지 계층이 더 실용적인 옵션이 될 수 있다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Jaskirat Sin... ב- arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17154.pdfשאלות מעמיקות