この記事では、差分プライベート(DP)機械学習がどのように訓練データのプライバシーを保護しながらモデルを訓練するためのゴールドスタンダードな解決策であるかに焦点を当てています。しかし、DP表現学習において特に目立つサブオプティマルなプライバシーと精度のトレードオフがあることが指摘されています。本稿では、画像キャプションを介した効果的なDP表現学習が可能であることを示し、インターネット規模のマルチモーダルデータセットにスケーリングアップします。エンジニアリングトリックの連続を通じて、合理的な計算量でLAION-2Bから233MのサブセットでDP画像キャプショナー(DP-Cap)をゼロから成功裏に訓練し、前例のない高品質な画像特徴を取得します。これらはさまざまな下流ビジョンおよびビジョン言語タスクで使用できます。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Tom Sander,Y... ב- arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.02506.pdfשאלות מעמיקות