핵심 개념
온라인 학습에서 안전 제약 조건을 준수하면서 후회를 최소화하는 일반 메타 알고리즘을 제시합니다.
초록
온라인 학습의 안전 제약 조건 문제를 다룸
안전 제약 조건을 만족하면서 후회를 최소화하는 알고리즘 소개
온라인 회귀 오라클과 온라인 학습 오라클을 활용한 이론적 결과 제시
선형 제약 조건에 대한 구체적인 알고리즘 제시
통계
알려지지 않은 안전 제약 조건을 추정하기 위해 온라인 회귀 오라클을 활용합니다.
인용구
"온라인 학습은 순차적 의사 결정을 위한 중요한 도구입니다."
"알려지지 않은 매개변수를 학습해야 하는 학습자는 안전 제약 조건을 파악해야 합니다."