Основные понятия
SecureBoostアルゴリズムの欠点である、プライバシー漏洩と適切なハイパーパラメータ最適化の問題を解決するため、インスタンスクラスタリング攻撃(ICA)を提案し、それを防ぐ2つの防御手法を開発した。さらに、効用損失、学習コスト、プライバシー漏洩の3つの目的関数を同時に最小化する制約付き多目的SecureBoost(CMOSB)アルゴリズムを提案した。
Аннотация
本論文では、SecureBoostアルゴリズムの2つの主要な限界点に取り組んでいる。
-
プライバシー漏洩: SecureBoostは中間情報を通じてラベル漏洩の可能性があるため、ラベルプライバシーを保護するための防御メカニズムが必要である。
-
ハイパーパラメータ最適化: 経験的なハイパーパラメータ設定では、効用、効率、プライバシーの間の最適なトレードオフを得られない可能性がある。
そこで以下の取り組みを行った:
-
インスタンスクラスタリング攻撃(ICA)の提案: ICАは、SecureBoostの脆弱性を利用してラベル情報を推測する新しい攻撃手法である。
-
ICAに対する2つの防御手法の提案:
- ローカルツリー: 最初の数回の反復でローカルに決定木を学習することで、ラベルとインスタンス分布の相関を減らす。
- ピュアリティしきい値: ノードのピュアリティが高い場合、受動的なパーティは学習に参加できないようにする。
-
制約付き多目的SecureBoost(CMOSB)アルゴリズムの提案:
- 効用損失、学習コスト、プライバシー漏洩の3つの目的関数を同時に最小化する。
- パレート最適解を見つけ、参加者が目的に応じて最適なハイパーパラメータを選択できるようにする。
実験の結果、提案手法は既存手法よりも優れたパレート最適解を見つけられることが示された。また、制約付きCMOSBアルゴリズムは、参加者の要件に合わせてより良いハイパーパラメータを見つけられることが確認された。
Статистика
SecureBoostでは最大84%のラベルが漏洩する可能性がある。
ローカルツリー手法により、プライバシー漏洩を25.1%減らすことができる一方で、効用損失は1.6%増加する。
ピュアリティしきい値手法により、プライバシー漏洩を大幅に減らすことができる。
Цитаты
"SecureBoostは依然としてラベル漏洩の可能性に直面しており、ホモモーフィック暗号化を使ってインスタンスグラジエントを保護しているにもかかわらず、インスタンス分布の保護が欠如しているため、防御メカニズムが必要である。"
"経験的なハイパーパラメータ設定では、効用、効率、プライバシーの間の最適なトレードオフを得られない可能性がある。"