核心概念
確率論的関係モデル(PFG)を用いて、関係データベースから新しい合成関係データを生成する手法を提案する。
摘要
本論文では、関係データベースからPFGを学習し、その上で新しい合成関係データを生成する手法を提案している。
具体的には以下の手順で行う:
-
関係データベースから、プロポジショナルなファクターグラフ(FG)を学習する。
- 個々のエンティティや関係に対応したランダム変数を導入する。
- 条件的独立性テストに基づいてFGの構造を学習する。
- ファクターの潜在的を学習する。
-
学習したFGをACP(Advanced Colour Passing)アルゴリズムを用いてPFGに変換する。
- FGの中の対称性を見つけ出し、同一視できるランダム変数やファクターをグループ化する。
- グループ化されたランダム変数にはロジック変数を割り当てる。
-
学習したPFGから新しい合成関係データを生成する。
- PFGが表す確率分布に従って、新しい関係データを生成できる。
- 生成されたデータは、元のデータベースの構造を保ちつつ、新しい組み合わせのデータが得られる。
本手法の利点は、PFGが関係データの構造を効果的にモデル化できること、プライバシー保護の観点から有望であること、などが挙げられる。
統計資料
年齢が18歳未満の患者は5人、18歳以上の患者は10人いる。
低コストの薬は3種類、高コストの薬は2種類ある。
患者と薬の組み合わせのうち、実際に使用されているのは8つである。