이 논문은 확률적으로 확장된 적대적(SEA) 모델에서 최적화 온라인 미러 하강법의 이론적 성능을 분석한다.
주요 내용은 다음과 같다:
볼록 및 매끄러운 기대 손실 함수의 경우, 최적화 온라인 미러 하강법은 누적 확률적 분산 σ2
1:T와 누적 적대적 변동 Σ2
1:T에 의존하는 O(√σ2
1:T + √Σ2
1:T) 기대 정적 후회 경계를 달성한다. 이는 개별 함수의 볼록성이 아닌 기대 함수의 볼록성만을 요구한다는 점에서 기존 연구보다 약한 가정이다.
강볼록 및 매끄러운 기대 손실 함수의 경우, 최적화 온라인 미러 하강법은 O(1/λ(σ2
max + Σ2
max)log((σ2
1:T + Σ2
1:T)/(σ2
max + Σ2
max))) 기대 정적 후회 경계를 달성하여, 기존 연구보다 개선된 결과를 보인다.
지수오목 및 매끄러운 기대 손실 함수의 경우, 최적화 온라인 미러 하강법은 O(d log(σ2
1:T + Σ2
1:T)) 기대 정적 후회 경계를 달성하는 새로운 결과를 제시한다.
또한 볼록 및 매끄러운 기대 손실 함수에 대해 동적 후회 최소화를 다루며, O(PT + √1 + PT(√σ2
1:T + √Σ2
1:T)) 기대 동적 후회 경계를 제공한다.
비매끄러운 손실 함수에 대해서도 최적화 온라인 미러 하강법과 암묵적 업데이트를 결합한 새로운 알고리즘을 제안하여, 정적 및 동적 후회에 대한 보장을 달성한다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問