本稿では、新しい大規模多言語コードデバッグベンチマークであるMDEVALを提案し、自動プログラム修復、コードレビュー、バグ識別の3つのタスクにおけるオープンソースモデルとクローズドソースモデルのデバッグ性能を評価した。