Основні поняття
데이터 노이즈가 존재할 때 경험적 위험 최소화(ERM) 기법은 특이 상관관계에 더 의존하게 되어 일반화 성능이 저하되지만, 일부 도메인 일반화 알고리즘은 노이즈 강건성을 가지고 있어 이를 완화할 수 있다.
Статистика
데이터 노이즈 수준이 높아질수록 소수 그룹의 테스트 오류가 크게 증가한다.
더 많은 데이터를 사용하면 노이즈의 영향을 줄일 수 있다.
노이즈 수준이 높아질수록 ERM 기반 모델의 가중치 norm이 DG 모델보다 작아진다.
Цитати
"데이터 노이즈는 특이 상관관계의 영향을 악화시켜 일반화 성능을 저하시킨다."
"일부 DG 알고리즘은 노이즈 강건성을 가지고 있어 이를 완화할 수 있다."