toplogo
로그인

온라인 무제한 메모리 컨벡스 최적화


핵심 개념
과거 결정들의 전체 이력이 현재 손실에 영향을 미치는 온라인 컨벡스 최적화 문제를 다룸.
초록

이 논문은 온라인 컨벡스 최적화(OCO) 프레임워크를 일반화하여 "온라인 무제한 메모리 컨벡스 최적화"를 제안합니다. 이 프레임워크에서는 현재 손실이 과거 모든 결정에 의존할 수 있습니다.

주요 내용은 다음과 같습니다:

  1. p-유효 메모리 용량 Hp를 도입하여 과거 결정이 현재 손실에 미치는 최대 영향을 정량화합니다.
  2. Hp에 의존하는 O(√HpT) 정책 후회 상한을 증명하고, 이것이 최악의 경우 tight함을 보입니다.
  3. 유한 메모리 OCO의 첫 번째 비-trivial 하한을 증명합니다.
  4. 온라인 선형 제어와 온라인 성과 예측 문제에 이 프레임워크를 적용하여 기존 결과를 개선합니다.
edit_icon

요약 맞춤 설정

edit_icon

AI로 다시 쓰기

edit_icon

인용 생성

translate_icon

소스 번역

visual_icon

마인드맵 생성

visit_icon

소스 방문

통계
현재 손실 ft(ht)는 과거 모든 결정 x1, ..., xt에 의존함. 정책 후회는 PT t=1 ft(ht) - minx∈X PT t=1 ˜ ft(x)로 정의됨. p-유효 메모리 용량 Hp는 과거 결정이 현재 손실에 미치는 최대 영향을 나타냄.
인용구
없음

핵심 통찰 요약

by Raunak Kumar... 게시일 arxiv.org 04-02-2024

https://arxiv.org/pdf/2210.09903.pdf
Online Convex Optimization with Unbounded Memory

더 깊은 질문

온라인 학습 문제에서 비선형 동적 시스템을 다루는 방법은 무엇일까?

온라인 학습 문제에서 비선형 동적 시스템을 다루기 위해서는 기존의 선형 시스템에 적용된 방법을 확장해야 합니다. 일반적으로, 비선형 동적 시스템에서는 상태와 제어 입력 간의 관계가 선형이 아니기 때문에 더 복잡한 모델링이 필요합니다. 비선형 동적 시스템을 다루는 한 가지 방법은 상태와 제어 입력 간의 비선형 관계를 근사하는 방법입니다. 이를 위해 다양한 비선형 함수 근사 기법을 사용할 수 있습니다. 또한, 비선형 동적 시스템을 선형 시스템으로 근사하여 선형 시스템에 적용 가능한 기존의 알고리즘을 활용할 수도 있습니다. 또한, 비선형 동적 시스템을 다루기 위해서는 상태 및 제어 입력의 비선형성을 고려한 새로운 알고리즘 및 모델링 기법을 개발해야 합니다. 이를 통해 비선형 동적 시스템에서도 효과적인 온라인 학습을 수행할 수 있습니다.
0
star