Khái niệm cốt lõi
GPT-4を使用して、表形式データの機密性を損なうことなく有用性を維持するための手法を探索する。
Tóm tắt
本研究では、GPT-4を使用して表形式データの機密性と有用性のトレードオフを管理する手法を提案している。
- 表形式データをテキスト形式に変換し、GPT-4にプロンプトを与えることで、機密情報の推定を困難にしつつ有用な属性の推定を可能にする。
- 2つのタスクを設定し、提案手法の有効性を検証した。
- タスク1では、性別を機密情報、収入区分を有用情報として設定した。
- タスク2では、収入区分を機密情報、性別を有用情報として設定した。
- 提案手法は、既存の敵対的最適化手法と同程度の機密性保護性能を示した。
- ただし、公平性の観点では、既存手法ほど良好な結果が得られなかった。
- 今後のモデル改善により、公平性も担保できる可能性がある。
Thống kê
年齢、職業、収入が50,000ドル以上かどうかの正解率は0.88と高い。
提案手法GPT-4 (P1)では、性別の正解率を0.65まで低下させることができた。
GPT-4 (P2)では、収入区分の正解率を0.88に維持しつつ、性別の正解率を0.75まで低下させた。
Trích dẫn
"LLMsは、トレーニングデータの漏洩に関する懸念だけでなく、推論能力の向上によるプライバシー侵害の問題も抱えている。"
"本研究は、LLMsを活用してテーブルデータのプライバシーを保護しつつ有用性を維持する手法を初めて探索したものである。"