核心概念
個人情報保護規制の実施に伴い、機械学習分野は「忘れられる権利」に直面している。機械学習モデルから特定のデータを削除し、その影響を低減する機械学習忘却が注目されている。特に大規模言語モデル(LLM)における機械学習忘却は重要な課題となっている。
摘要
本サーベイは、機械学習忘却の定義、分類、評価基準、および異なる環境における課題とその解決策について詳しく探究する。具体的には、伝統的モデルとLLMの両方における機械学習忘却を分類し、忘却の有効性と効率性を評価する方法、および性能測定の基準を提案する。本論文は、現在の忘却技術の限界を明らかにし、恣意的な忘却を避けるための包括的な忘却評価の重要性を強調する。本サーベイは機械学習忘却の主要概念をまとめるだけでなく、その重要な問題点と将来の研究の実現可能な方向性を示し、この分野の研究者に有益な指針を提供する。
統計資料
個人情報保護法の制定により、機械学習分野は「忘れられる権利」に直面している。
機械学習モデルの開発と改善には、データセットが不可欠である。
個人情報の削除要求に応えつつ、モデルの完全性と有用性を維持することが重要な課題となっている。
機械学習忘却は、モデルからデータを選択的に削除または軽減する手法を研究する新しい分野である。
引述
「機械学習忘却は、ユーザーの要求に応じてデータを削除し、モデルへの影響を低減することを目的とする」
「機械学習忘却は、モデルの完全性と有用性を損なうことなく、プライバシー規制に準拠することを目指す」