이 연구는 온디바이스 DL 모델의 보안 및 성능 문제를 해결하기 위해 순수 코드 구현으로 대체하는 방법을 제안한다.
모델 파싱 단계에서는 DL 모델의 연산자와 매개변수 정보를 분석한다. 연산 단위 추출 단계에서는 DL 라이브러리에서 각 연산자에 해당하는 계산 코드 단위를 찾아낸다. 데이터 구성 분석 단계에서는 각 계산 단위에 필요한 데이터를 구성한다. 동적 구성 단계에서는 불확실한 상태 정보를 자동으로 구성하여 완전한 C++ 프로그램을 생성한다.
실험 결과, 제안 방법은 기존 온디바이스 모델 배포 방식보다 보안성이 높고, 모델 추론 속도를 21.0%(x86-64)와 24.3%(ARM64) 향상시켰으며, 메모리 사용량을 68.8%(x86-64)와 36.0%(ARM64) 감소시켰다. 이를 통해 제안 방법이 온디바이스 DL 모델의 보안과 성능을 크게 개선할 수 있음을 보여준다.
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Mingyi Zhou,... ที่ arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16479.pdfสอบถามเพิ่มเติม