Core Concepts
반지도 학습 환경에서 적대적 공격에 강건한 예측기를 학습하는데 필요한 레이블 및 무레이블 데이터의 양을 특성화한다. 이전 연구에 비해 레이블 데이터 복잡도가 크게 감소할 수 있음을 보여준다.
Abstract
이 논문은 반지도 학습 환경에서 적대적 공격에 강건한 예측기를 학습하는 문제를 다룬다. 저자들은 이러한 학습을 위해 필요한 레이블 및 무레이블 데이터의 양을 특성화한다.
주요 내용은 다음과 같다:
가설 공간 H와 교란 함수 U가 주어졌을 때, 마진 분포 DX의 지지대가 알려진 경우 레이블 데이터 복잡도는 Θ(VCU(H)/ε + log(1/δ)/ε)임을 보인다.
일반적인 경우에 대해 GRASS 알고리즘을 제안한다. 이 알고리즘은 레이블 데이터 복잡도 ˜O(VCU(H)/ε + log(1/δ)/ε)와 무레이블 데이터 복잡도 ˜O(VC(H)VC*/ε + log(1/δ)/ε)를 달성한다. 이는 이전 연구 결과인 Ω(RSU/ε)의 레이블 데이터 복잡도에 비해 큰 개선이다.
적대적 강건 학습에서 부적절 학습이 필요함을 보인다. 즉, 적절 학습 알고리즘으로는 최적의 성능을 달성할 수 없다.
적대적 강건 학습의 agnostic 설정에 대한 상한과 하한 경계를 제시한다. 이는 realizable 설정과 다른 구조를 가짐을 보여준다.
강건 실현가능성 가정 하에 0-1 손실 함수로 학습할 경우, VCU 복잡도에 선형적으로 의존하는 표본 복잡도로 학습할 수 있음을 보인다. 이는 적절 학습으로는 달성할 수 없음을 보인다.
요약하면, 이 논문은 반지도 학습 환경에서 적대적 강건 PAC 학습의 표본 복잡도를 특성화하고, 지도 학습에 비해 큰 개선을 보여준다.
Stats
레이블 데이터 복잡도는 O(VCU(H)/ε + log(1/δ)/ε)이다.
무레이블 데이터 복잡도는 ˜O(VC(H)VC*/ε + log(1/δ)/ε)이다.
강건 실현가능성 가정 하에 0-1 손실 함수로 학습할 경우, 표본 복잡도는 O(VCU(H)/ε log^2(VCU(H)/ε) + log(1/δ)/ε)이다.
Quotes
"이 논문은 반지도 학습 환경에서 적대적 공격에 강건한 예측기를 학습하는 문제를 다룬다."
"레이블 데이터 복잡도가 크게 감소할 수 있음을 보여준다."
"적대적 강건 학습에서 부적절 학습이 필요함을 보인다."