I2EBenchは、指示ベースの画像編集モデルの性能を多次元的に包括的に評価するためのベンチマークである。高水準編集と低水準編集の16の評価次元を設け、人間の知覚に合わせた評価を行い、各モデルの長所と短所を明らかにする。