แนวคิดหลัก
本論文では、連邦学習環境における決定木の集約プロセスを提案する。このプロセスは、クライアントの決定木を集約して解釈可能な単一の大域的決定木を構築する。この集約プロセスは、クライアントの決定木の品質を評価し、高品質な決定木のみを選択して集約することで、大域的決定木の性能を向上させる。
บทคัดย่อ
本論文では、連邦学習環境における決定木の集約プロセスを提案している。
- クライアントは各自のデータを用いて局所的な決定木を構築する。
- サーバーは各クライアントの決定木を受け取り、それらを評価する。低品質な決定木は除外される。
- サーバーは残された高品質な決定木の決定ルールを抽出し、それらを集約する。
- サーバーは集約された決定ルールを用いて大域的な決定木を構築する。
- 構築された大域的決定木はクライアントに送信され、クライアントはそれを自身のデータで評価する。
この集約プロセスは、ID3アルゴリズムとCARTアルゴリズムの2つのバリエーションを持つ。ID3ベースのモデルは、情報利得に基づいて決定木を構築する。CART ベースのモデルは、ジニ不純度に基づいて決定木を構築する。
提案手法は、複数のデータセットを用いた実験で、ベースラインモデルおよび最新の連邦学習決定木モデルよりも優れた性能を示した。また、クライアントの数が増加しても頑健性を維持することができた。さらに、提案手法は決定木の解釈可能性を保持しながら、大域的な決定木を構築できることが示された。
สถิติ
クライアントの決定木の性能が平均値を下回る場合、それらの決定木は除外される。
大域的決定木の構築時、情報利得が最大となる特徴を選択して決定木を分割する。