toplogo
Sign In

온라인 무제한 메모리 컨벡스 최적화


Core Concepts
과거 결정들의 전체 이력이 현재 손실에 영향을 미치는 온라인 컨벡스 최적화 문제를 다룸.
Abstract
이 논문은 온라인 컨벡스 최적화(OCO) 프레임워크를 일반화하여 "온라인 무제한 메모리 컨벡스 최적화"를 제안합니다. 이 프레임워크에서는 현재 손실이 과거 모든 결정에 의존할 수 있습니다. 주요 내용은 다음과 같습니다: p-유효 메모리 용량 Hp를 도입하여 과거 결정이 현재 손실에 미치는 최대 영향을 정량화합니다. Hp에 의존하는 O(√HpT) 정책 후회 상한을 증명하고, 이것이 최악의 경우 tight함을 보입니다. 유한 메모리 OCO의 첫 번째 비-trivial 하한을 증명합니다. 온라인 선형 제어와 온라인 성과 예측 문제에 이 프레임워크를 적용하여 기존 결과를 개선합니다.
Stats
현재 손실 ft(ht)는 과거 모든 결정 x1, ..., xt에 의존함. 정책 후회는 PT t=1 ft(ht) - minx∈X PT t=1 ˜ ft(x)로 정의됨. p-유효 메모리 용량 Hp는 과거 결정이 현재 손실에 미치는 최대 영향을 나타냄.
Quotes
없음

Key Insights Distilled From

by Raunak Kumar... at arxiv.org 04-02-2024

https://arxiv.org/pdf/2210.09903.pdf
Online Convex Optimization with Unbounded Memory

Deeper Inquiries

온라인 학습 문제에서 비선형 동적 시스템을 다루는 방법은 무엇일까?

온라인 학습 문제에서 비선형 동적 시스템을 다루기 위해서는 기존의 선형 시스템에 적용된 방법을 확장해야 합니다. 일반적으로, 비선형 동적 시스템에서는 상태와 제어 입력 간의 관계가 선형이 아니기 때문에 더 복잡한 모델링이 필요합니다. 비선형 동적 시스템을 다루는 한 가지 방법은 상태와 제어 입력 간의 비선형 관계를 근사하는 방법입니다. 이를 위해 다양한 비선형 함수 근사 기법을 사용할 수 있습니다. 또한, 비선형 동적 시스템을 선형 시스템으로 근사하여 선형 시스템에 적용 가능한 기존의 알고리즘을 활용할 수도 있습니다. 또한, 비선형 동적 시스템을 다루기 위해서는 상태 및 제어 입력의 비선형성을 고려한 새로운 알고리즘 및 모델링 기법을 개발해야 합니다. 이를 통해 비선형 동적 시스템에서도 효과적인 온라인 학습을 수행할 수 있습니다.
0