Główne pojęcia
이 연구는 온라인 학습 관점에서 반복적인 대리인-본인 문제를 연구합니다. 본인의 목표는 대리인의 유형(비용 및 생산 함수)에 대한 사전 지식 없이 반복적인 상호 작용을 통해 자신의 효용을 최대화하는 최적의 계약을 학습하는 것입니다.
Streszczenie
이 연구는 세 가지 다른 설정에서 단일 대리인과 계약하는 문제를 다룹니다:
- 대리인이 이질적인 경우
- 대리인이 동질적인 경우
- 본인이 동일한 대리인과 상호 작용하고 대리인이 비단기적인 경우
이질적 대리인 유형의 경우, 문제를 직접 Lipschitz 밴딧으로 축소할 수 있는 조건을 확인했습니다. 동일한 대리인의 경우, 역게임 이론에 기반한 다항식 샘플 복잡도 방식을 제시했습니다. 전략적 비단기적 대리인의 경우, 낮은 전략적 후회 메커니즘을 설계했습니다.
또한 팀 생산 모델을 연구했습니다. 본인의 학습 문제를 일련의 볼록 프로그램을 해결하는 것으로 재구성할 수 있는 조건을 확인했으며, 이를 통해 최적 계약을 효율적으로 찾을 수 있음을 보였습니다.
Statystyki
대리인의 비용 함수 cpaq는 λ-강볼록입니다.
보완적 누적 분포 함수 Gjpaq는 a에 대해 L-Lipschitz합니다.
최적 선형 계약을 학습하는 데 필요한 샘플 복잡도는 Oppolyp1{εqq입니다.
전략적 후회는 Op
?
Tq입니다.
Cytaty
"본인의 목표는 대리인의 유형(비용 및 생산 함수)에 대한 사전 지식 없이 반복적인 상호 작용을 통해 자신의 효용을 최대화하는 최적의 계약을 학습하는 것입니다."
"본인의 학습 문제를 일련의 볼록 프로그램을 해결하는 것으로 재구성할 수 있는 조건을 확인했으며, 이를 통해 최적 계약을 효율적으로 찾을 수 있음을 보였습니다."