本論文では、属性の閉包を計算するための3つのアルゴリズム(Closure、LinClosure、WildClosure)と3つの基底(Canonical-Direct Unit Basis、D-basis、Duquenne-Guigues Basis)の組み合わせを分析している。
まず、基底の特性として「最小性」と「直接性」について説明する。最小基底は依存関係の数が最小限に抑えられているが、閉包計算には複数回のパスが必要となる。一方、直接基底は閉包計算が1回のパスで完了するが、依存関係の数が多くなる可能性がある。
次に、3つのアルゴリズムの特徴を説明する。Closureは2次の時間計算量、LinClosureは線形の時間計算量、WildClosureは2次の時間計算量だが実行時間が速いという特徴がある。
その上で、直接基底を使う際のアルゴリズムの最適化について議論する。Canonical-Direct Unit Basisを使う場合は、Closureアルゴリズムの外側ループを1回に抑えられることを示す。一方、D-basisを使う場合は、最適化が困難であることを示す。
最後に、実データセットと合成データセットを用いた実験結果を分析する。実験では、実行時間、処理した依存関係の数、属性操作の回数を指標として、各アルゴリズムと基底の組み合わせを比較している。その結果、必ずしも理論的な時間計算量の優位性が実際の性能に反映されないことを示している。
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Jaume Baixer... lúc arxiv.org 04-19-2024
https://arxiv.org/pdf/2404.12229.pdfYêu cầu sâu hơn