Core Concepts
真の分類子を特定するために制御コストを最小化しながら、データセットを使用して真の分類子を特定するための制御アルゴリズムを提案します。
Abstract
2次元ユークリッド空間内の未知の線形分類子によって2つのセットに分割される領域が考えられます。
制御アルゴリズムは、真のラベルを完全に測定できる場合とノイズで汚染された場合に対応します。
ダイナミックプログラミングアプローチや確率空間などが使用されています。
INTRODUCTION
制御と学習(推定および推論問題も含む)の二重性が文献で広く研究されています。
系統的な探索と活用に関する制御問題が強調されています。
PROBLEM CONSIDERED
2次元空間内で与えられた領域は直線で分割され、真の分類子はその傾きと切片によってパラメータ化されます。
初期点から始まるエージェントは、制御コストを支払いながら領域を移動し、真の分類子を特定することが目的です。
CONTRIBUTIONS
真のクラスター識別問題を制御問題として定式化しました。
制御アルゴリズムや収束性など多くの成果が示されています。
Stats
数値例示:「4つの初期点は互いに「遠い」位置にあります。」
Quotes
"Learning problems could benefit from being formulated as control problems by channelizing feedback to reduce the quantity of data required to solve the learning problem efficiently and accurately."