核心概念
画像認識AI向けのエッジ情報学習に焦点を当てた新しい画像コーディング手法の提案。
要約
本論文では、SA-ICMとSA-NeRVという新しい手法を提案しています。SA-ICMは、エッジ情報学習を活用してオブジェクト形状を符号化および復号化するLICモデルを構築します。従来の手法よりも優れた画像圧縮性能が示されています。また、プライバシー保護の観点からも利点があり、さまざまなユースケースへの柔軟性があります。さらに、NeRVでデコードされた画像の画像認識精度が改善されることが確認されました。
統計
JPEG [1], AVC/H.264 [2], HEVC/H.265 [3], VVC/H.266 [4]
COCO, VisDrone [27], Cityscapes [20]
YOLOv5, Mask-RCNN, Panoptic-deeplab
引用
"Image Coding for Machines (ICM) is an image compression technique for image recognition."
"SA-ICM is also robust to changes in input data, making it effective for a variety of use cases."
"Our method can be used in various use cases and shows the best performance in image compression for image recognition."