バンディット環境下でインセンティブ整合的な学習アルゴリズムを設計することは、最適な専門家の信念に対する後悔を最小化するために重要である。しかし、既存のアルゴリズムでは最適な後悔率を達成できないことが示された。