核心概念
本論文は、科学データセットの誤差制限付きロスレス圧縮技術に関する包括的なサーベイを提供する。主要な貢献は以下の4点である。(1) ロスレス圧縮の6つの古典的なモデルからなる分類法を要約する。(2) 誤差制限付きロスレス圧縮機で使用される10種類以上の一般的な圧縮コンポーネントについて包括的にサーベイする。(3) 10種類以上の最先端の誤差制限付きロスレス圧縮機について、それらの設計における様々な圧縮モジュールの組み合わせ方を包括的にサーベイする。(4) 10種類以上の最新の科学アプリケーションと利用事例における誤差制限付きロスレス圧縮技術について包括的にサーベイする。
要約
本論文は、誤差制限付きロスレス圧縮技術に関する包括的なサーベイを提供する。
まず、ロスレス圧縮の6つの古典的なモデルからなる分類法を提案する。これらのモデルには、それぞれ時間/空間複雑性と再構成品質の異なる特徴がある。
次に、10種類以上の一般的な圧縮コンポーネントについて詳しく解説する。これらのコンポーネントには、ポイントワイズデータ予測、量子化、直交/ウェーブレット変換、HOSVD、ディシメーション/サンプリング、フィルタリング、無損失エンコーディング、深層学習ネットワークなどが含まれる。
さらに、30種類以上の最先端の誤差制限付きロスレス圧縮機について、それらの設計における様々な圧縮モジュールの組み合わせ方を12例について詳しく分析する。これらの圧縮機には、一般的な誤差制限付きロスレス圧縮機(SZ、ZFP)だけでなく、特定の利用事例向けに最適化された圧縮機(SPERR、AESZ、FAZ、MDZ)も含まれる。
最後に、10種類以上の最新の科学アプリケーションと利用事例における誤差制限付きロスレス圧縮技術について包括的にサーベイする。
本論文は、科学アプリケーション、高性能コンピューティング、ロスレス圧縮、ビッグデータの各コミュニティにとって有用な情報を提供する。
統計
科学シミュレーションやデータ取得では、250 GB/sの高速データストリームが生成される可能性がある。
50量子ビットシステムの完全な量子状態を保存するには16ペタバイトのメモリが必要である。