本文提出了一個新的多臂老虎機框架,稱為圖觸發式多臂老虎機(Graph-Triggered Bandits, GTBs)。在這個框架中,臂的預期獎勵隨時間的演化受到一個定義在臂上的圖的影響。這個框架可以統一和推廣已知的休息型(rested)和無休息型(restless)多臂老虎機。作者重點研究了上升型(rising)和腐爛型(rotting)GTBs,並提出了相應的最優策略和無後悔算法。