大規模な言語モデルが個人データを記憶し、機密情報を抽出するプライバシーリスクがあることが明らかになった。この攻撃は10%以上の成功率でクレジットカード番号などの機密情報を抽出可能。攻撃者は少数の文を挿入して攻撃を行う。また、3つの段階から成り立ち、事前学習、微調整、推論の各段階で秘密情報を取得する。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Ashwinee Pan... kl. arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.00871.pdfDybere Forespørgsler