핵심 개념
온디바이스 DL 모델을 순수 코드 구현으로 대체하여 보안을 강화하고 성능을 향상시킬 수 있다.
초록
이 연구는 온디바이스 DL 모델의 보안 및 성능 문제를 해결하기 위해 순수 코드 구현으로 대체하는 방법을 제안한다.
모델 파싱 단계에서는 DL 모델의 연산자와 매개변수 정보를 분석한다. 연산 단위 추출 단계에서는 DL 라이브러리에서 각 연산자에 해당하는 계산 코드 단위를 찾아낸다. 데이터 구성 분석 단계에서는 각 계산 단위에 필요한 데이터를 구성한다. 동적 구성 단계에서는 불확실한 상태 정보를 자동으로 구성하여 완전한 C++ 프로그램을 생성한다.
실험 결과, 제안 방법은 기존 온디바이스 모델 배포 방식보다 보안성이 높고, 모델 추론 속도를 21.0%(x86-64)와 24.3%(ARM64) 향상시켰으며, 메모리 사용량을 68.8%(x86-64)와 36.0%(ARM64) 감소시켰다. 이를 통해 제안 방법이 온디바이스 DL 모델의 보안과 성능을 크게 개선할 수 있음을 보여준다.
통계
제안 방법은 x86-64 플랫폼에서 모델 추론 속도를 21.0% 향상시켰다.
제안 방법은 ARM64 플랫폼에서 모델 추론 속도를 24.3% 향상시켰다.
제안 방법은 x86-64 플랫폼에서 메모리 사용량을 68.8% 감소시켰다.
제안 방법은 ARM64 플랫폼에서 메모리 사용량을 36.0% 감소시켰다.