Główne pojęcia
ONNXPruner는 ONNX 형식의 모델에 대해 다양한 모델 구조에 자동으로 적응할 수 있는 범용 모델 압축 어댑터입니다. 노드 연관 트리를 사용하여 압축된 노드와 연관된 노드 간의 관계를 명확히 정의하고, 트리 수준 평가 방법을 통해 압축 성능을 향상시킵니다.
Streszczenie
이 논문은 ONNX 기반 범용 모델 압축 어댑터 ONNXPruner를 제안합니다. ONNXPruner는 다양한 딥러닝 프레임워크와 하드웨어 플랫폼에서 압축 알고리즘의 상호운용성을 높입니다.
핵심 내용은 다음과 같습니다:
- ONNXPruner는 노드 연관 트리를 사용하여 압축된 노드와 연관된 노드 간의 관계를 명확히 정의합니다. 이를 통해 다양한 모델 구조에 자동으로 적응할 수 있습니다.
- 트리 수준 평가 방법을 도입하여 단일 노드 평가를 넘어 복잡한 노드 연결 구조를 종합적으로 평가할 수 있습니다. 이를 통해 추가 구성 요소나 연산 없이도 압축 성능을 향상시킬 수 있습니다.
- 실험 결과, ONNXPruner는 다양한 모델과 데이터셋에서 우수한 적응성과 효과성을 보여줍니다.
Statystyki
압축 후에도 VGG16 모델의 CIFAR-10 정확도가 90% 이상을 유지합니다.
ResNet50 모델의 ImageNet Top-1 정확도 감소가 1.24%p에 불과합니다.
FCN 모델의 PASCAL VOC 2012 mIoU가 0.7% 향상되었습니다.
Cytaty
"ONNXPruner는 ONNX 형식의 모델에 대해 다양한 모델 구조에 자동으로 적응할 수 있는 범용 모델 압축 어댑터입니다."
"노드 연관 트리를 사용하여 압축된 노드와 연관된 노드 간의 관계를 명확히 정의하고, 트리 수준 평가 방법을 통해 압축 성능을 향상시킵니다."