Core Concepts
주어진 2D 유클리드 공간에서 알 수 없는 선형 분류기에 의해 두 개의 레이블이 지정된 영역을 통과하는 에이전트는 제어 비용을 최소화하면서 실제 분류기를 식별하는 것이 목표이다.
Abstract
이 논문은 선형 분류기 식별 문제를 제어 문제로 정식화하고 있다. 두 가지 시나리오를 고려한다: (i) 에이전트가 실제 레이블을 완벽하게 측정할 수 있는 경우, (ii) 관측된 레이블이 실제 레이블에 노이즈가 곱해진 경우.
논문의 주요 내용은 다음과 같다:
선형 분류기 식별 문제를 제어 문제로 정식화
제어 문제의 기하학적 해석과 이를 활용한 1단계 제어 문제 정의
노이즈가 없는 경우와 있는 경우에 대한 별도의 제어 알고리즘 제안
노이즈가 없는 경우 추정된 분류기가 실제 분류기로 수렴함을 증명
수치 예제를 통해 제안된 알고리즘의 유용성 입증
Stats
주어진 4개의 점 (p1, p2, p3, p4)의 실제 레이블은 각각 -1, 1, 1, -1이다.
에이전트는 총 m개의 데이터 포인트를 수집한다.