Core Concepts
기계 학습 모델은 데이터를 잊거나 삭제하는 데 어려움을 겪을 수 있음
Abstract
1. 인공지능 부흥
1990년대에는 AI 연구가 침체 상태였으나, 현재는 AI 붐이 일어나고 있음.
대규모 데이터셋과 대량 생산된 GPU의 동시적 가용성이 AI 발전을 촉진함.
2. 법적 배경
유럽연합의 잊힐 권리는 GDPR의 규정에 따라 개인 데이터 삭제를 요청할 수 있는 권리를 부여함.
기계 학습과 잊힐 권리 간의 본질적인 간극이 존재함.
3. 기계 학습
대부분의 AI 기술은 기계 학습의 하위 분야인 딥 러닝의 예시임.
딥 러닝 모델은 대량의 데이터를 사용하여 패턴을 식별하고 데이터를 생성함.
4. 화해로 가는 길
기계 학습 모델을 처음부터 다시 훈련시키는 것이 해결책 중 하나임.
현재 사용 가능한 기계 학습 모델 삭제 알고리즘을 사용하는 것은 오차가 발생할 수 있음.
5. 후렴: 디지털 암네지악
현재 인터넷에서 사용 가능한 AI 법안은 기계 학습과 삭제 권리 사이의 간극을 해결하지 못함.
기계 학습과 잊힐 권리는 본질적으로 상충되는 요소임.
Stats
GPT-4는 1.7조 개의 매개변수와 13조 토큰에 대해 훈련되었음.
GPT-3는 1750억 개의 매개변수를 가지고 있음.
Quotes
"기계 학습 모델이 데이터를 삭제하는 것은 매우 어려울 수 있습니다."
"기계 학습과 잊힐 권리는 본질적으로 상충되는 요소입니다."