核心概念
確率論的関係モデル(PFG)を用いて、関係データベースから新しい合成関係データを生成する手法を提案する。
要約
本論文では、関係データベースからPFGを学習し、その上で新しい合成関係データを生成する手法を提案している。
具体的には以下の手順で行う:
関係データベースから、プロポジショナルなファクターグラフ(FG)を学習する。
個々のエンティティや関係に対応したランダム変数を導入する。
条件的独立性テストに基づいてFGの構造を学習する。
ファクターの潜在的を学習する。
学習したFGをACP(Advanced Colour Passing)アルゴリズムを用いてPFGに変換する。
FGの中の対称性を見つけ出し、同一視できるランダム変数やファクターをグループ化する。
グループ化されたランダム変数にはロジック変数を割り当てる。
学習したPFGから新しい合成関係データを生成する。
PFGが表す確率分布に従って、新しい関係データを生成できる。
生成されたデータは、元のデータベースの構造を保ちつつ、新しい組み合わせのデータが得られる。
本手法の利点は、PFGが関係データの構造を効果的にモデル化できること、プライバシー保護の観点から有望であること、などが挙げられる。
統計
年齢が18歳未満の患者は5人、18歳以上の患者は10人いる。
低コストの薬は3種類、高コストの薬は2種類ある。
患者と薬の組み合わせのうち、実際に使用されているのは8つである。