Concetti Chiave
データマスキングは、個人データの記録リンケージなど、さまざまなアプリケーション領域で重要性が高まっており、Pattern Masking for Dictionary Matching(PMDM)問題を形式化することで、データユーティリティの保証を提供する。
Sintesi
この記事では、パターンマスキングによる辞書マッチング(PMDM)問題に焦点を当てています。データマスキングは個人データの処理において重要であり、記録リンケージなどのアプリケーション領域で利用されます。PMDM問題はNP困難であり、最適な解法を提供します。複数のクエリ文字列を同時に処理するMPMDM問題も考慮されています。さらに、PMDMクエリに対応するための効率的なデータ構造も提案されています。
Statistiche
PMDM問題はNP完全であることが示されました。
PMDM問題への効率的なアルゴリズムが提案されました。
MPMDM問題への解決策が提示されました。
データ構造SplitがPMDMクエリに対応するために使用されます。
記録リンケージシステム向けのプライバシー保護とユーティリティ保証が強調されています。
クエリ用語削除や最大クレート探索など、実用的な応用例も考慮されています。
Citazioni
"Data masking is a common technique for sanitizing sensitive data maintained in database systems."
"Offering such privacy is desirable in real record linkage systems where databases containing personal data are being linked."
"Record linkage is an important application for our techniques, because no existing approach can provide privacy and utility guarantees when releasing linkage results to domain experts."