Keskeiset käsitteet
기초 모델을 이용한 소량 샘플 분류는 적은 수의 레이블링된 학습 샘플로도 정확한 분류기를 구축할 수 있지만, 데이터 오염 공격에 취약하다. 본 연구에서는 데이터 오염 공격에 대한 인증 가능한 방어 기법 FCert를 제안한다.
Tiivistelmä
본 논문은 기초 모델(예: CLIP, DINOv2, PaLM-2)을 활용한 소량 샘플 분류의 문제점과 해결책을 제안한다.
소량 샘플 분류는 적은 수의 레이블링된 학습 샘플(지원 샘플)로도 정확한 분류기를 구축할 수 있지만, 공격자가 일부 지원 샘플을 조작하여 원하는 예측 결과를 얻을 수 있는 데이터 오염 공격에 취약하다. 기존 경험적 방어 기법은 공식적인 강건성 보장을 제공하지 못하며, 전통적인 지도 학습을 위해 설계된 인증 방어 기법은 소량 샘플 분류에 적용할 경우 성능이 저하된다.
본 연구에서는 FCert, 소량 샘플 분류에 대한 최초의 인증 방어 기법을 제안한다. FCert는 지원 샘플의 일부가 오염되더라도 동일한 예측 결과를 보장한다. 실험 결과, FCert는 기존 소량 샘플 분류 방법 및 인증 방어 기법 대비 높은 정확도와 강건성을 보였으며, 효율적인 성능을 달성했다.
Tilastot
공격자가 지원 샘플 중 최대 T개를 조작할 수 있는 경우에도 FCert는 동일한 예측 결과를 보장한다.
개별 공격의 경우 T는 최대 ⌊(K-1)/2⌋이며, 그룹 공격의 경우 T는 최적화 문제의 해로 계산된다.
Lainaukset
"기초 모델을 이용한 소량 샘플 분류는 적은 수의 레이블링된 학습 샘플로도 정확한 분류기를 구축할 수 있지만, 데이터 오염 공격에 취약하다."
"본 연구에서는 FCert, 소량 샘플 분류에 대한 최초의 인증 방어 기법을 제안한다."