本論文では、Android バックアップデータの圧縮に特化したPatternRankアルゴリズムを提案している。従来のGZIPなどの一般的な圧縮手法では、Android バックアップデータに含まれる大量のXMLデータの特性を十分に活かせないという課題があった。
PatternRankアルゴリズムは、以下の2つのバージョンを提案している:
バージョン1では、動的にパターンを抽出し、頻度と長さに基づいて順位付けを行い、短いコードに置き換えることで圧縮を行う。
バージョン2では、さらに事前に定義したディクショナリを活用し、XMLファイルに含まれる一般的なタグや属性名などの反復パターンを先行して圧縮する。その後、残りのデータに対して動的なパターン抽出と順位付けを行う。
さらに、PatternRankアルゴリズムとハフマン符号化を組み合わせることで、パターンベースの圧縮とデータ統計に基づく圧縮を融合し、より高度な圧縮性能を実現している。
本手法は、Android バックアップデータの圧縮に留まらず、様々なデータ圧縮の課題に対して適用可能な汎用的なアプローチを示している。今後のデータ圧縮技術の発展に大きな貢献が期待される。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor