Core Concepts
ONNXPrunerは、ONNX形式のモデルに対して、様々なモデル構造に自動的に適応できる汎用的な圧縮アダプターを提供する。ノード関連ツリーを使用して複雑なノード間の関係を明確に定義し、ツリーレベルの評価手法により、関連ノードの影響を包括的に考慮することで、圧縮性能を向上させる。
Abstract
本論文では、ONNXPrunerと呼ばれる汎用的なモデル圧縮アダプターを提案している。
ONNXPrunerは、ONNX形式のモデルに対して、様々なモデル構造に自動的に適応できる。これにより、開発フレームワークに依存せずに、圧縮アルゴリズムを容易に適用できる。
ノード関連ツリーを構築することで、圧縮対象ノードと関連ノードの関係を明確に定義する。これにより、圧縮時の連鎖的な影響を効果的に管理できる。
ツリーレベルの評価手法を導入し、圧縮対象ノードと関連ノードの重要性を包括的に評価する。これにより、従来の単一ノードの評価手法よりも優れた圧縮性能を実現する。
様々なモデルとデータセットで実験を行い、ONNXPrunerの高い適応性と効果を確認した。特に、ImageNetデータセットのResNet50モデルでは、従来手法よりも高い精度を維持しつつ、高い圧縮率を達成した。
画像分類タスクだけでなく、セグメンテーションタスクのFCNとPSPNetモデルでも、ONNXPrunerの有効性を示した。
以上のように、ONNXPrunerは、深層学習モデルの実用的な圧縮を促進する重要な取り組みである。
Stats
圧縮率90.19%時のVGG16のCIFAR-10精度は90.16%
圧縮率74.02%時のVGG16のCIFAR-10精度は91.07%
ResNet50のImageNet Top-1精度は、ℓ1-normで1.24%低下、ONNXPruner(ℓ1)で1.24%低下
ResNet50のImageNet Top-1精度は、Hrankで1.15%低下、ONNXPruner(Hrank)で0.69%低下
FCNのPASCAL VOC 2012 mean IoUは、ℓ1-normで60.3、ONNXPruner(ℓ1)で61.0
PSPNetのPASCAL VOC 2012 mean IoUは、ℓ1-normで78.7、ONNXPruner(ℓ1)で80.1