対話型証明システムを用いることで、従来の学習アルゴリズムよりも効率的に学習を行うことができる。特に、Fourier解析に基づく手法、AC0[2]回路の学習、k-juntaの学習などで、量的・質的な改善が得られる。さらに、無制限の証明者を許容すれば、任意のクラスの関数について、非常に少ないサンプル数で学習できる。
提案するアルゴリズムFGTS.CDSは、文脈依存デューリングバンディットの問題に対して、感情的トンプソンサンプリングを適用したものである。従来のUCBベースのアルゴリズムと比べ、より効率的に大規模な行動空間を扱うことができる。また、理論的にはミニマックス最適な後悔bound を達成する。