Die Arbeit präsentiert effiziente Algorithmen für das Lernen in Principal-Agent Banditenspielen, die die Interaktion zwischen Prinzipal und Agent berücksichtigen.