본 논문에서는 시간에 따라 변화하는 볼록스-오목 게임 시퀀스를 포함하는 온라인 안장점 문제(OSP)를 해결하기 위해 근접점 방법의 세 가지 변형, 즉 온라인 근접점 방법(OPPM), 낙관적 OPPM(OptOPPM) 및 다중 예측자를 사용하는 OptOPPM을 제안합니다. 이러한 알고리즘은 듀얼리티 갭과 동적 내쉬 균형 후회 모두에 대한 상한을 보장하며, 특히 고정 페이오프 함수 시퀀스와 같은 특정 양호한 환경에서 거의 일정한 메트릭 경계를 유지합니다. 또한 동적 내쉬 균형 후회를 성능 지표로 사용하는 것과 관련된 잠재적인 안정성 문제를 논의하고 실험을 통해 제안된 알고리즘의 효과를 검증합니다.
광고 경매에서 CTR 예측을 위한 온라인 학습 알고리즘의 개선