核心概念
提案するHPEZは、既存の高性能な誤差制限付きロスレス圧縮手法よりも大幅に高い圧縮率を達成し、かつ高速な圧縮・伸張速度を維持する。これは、新しい補間予測手法と自動調整機能の導入により実現される。
要約
本論文では、高性能で効果的な科学的誤差制限付きロスレス圧縮手法HPEZ(QoZ 2.0)を提案する。
- 補間の再順序付け、多次元補間、自然三次スプラインなどの新しい技術を開発し、補間ベースの予測精度を大幅に向上させた。
- 自動調整モジュールには、ブロック単位の補間調整、動的次元凍結、Lorenzo調整などの新機能を導入し、入力データに対する適応性を高めた。
- 6つの実世界の科学データセットで評価した結果、HPEZは既存の高性能な誤差制限付き圧縮手法と比べて、同じ誤差制限下で最大140%、同じPSNR下で最大360%高い圧縮率を達成した。また、分散データベースでの並列データ転送実験では、最大40%の時間コスト削減を実現した。
統計
1つのHACC(Hardware/Hybrid Accelerated Cosmology Code)シミュレーションで約22PBのデータが生成される
CESM(Community Earth System Model)シミュレーションでは2.5PBのデータが生成される
引用
"エラー制限付きロスレス圧縮は、ユーザーの要求に応じてデータ歪みを厳密に制限しつつ、元のデータを驚くほど小さなサイズに圧縮できる有望な解決策として認識されている。"
"既存の高性能エラー制限付き圧縮手法の中には、かなり高い圧縮率を達成できるものや、高速な圧縮速度を持つものがあるが、両者を同時に実現するものはほとんどない。"