視覚変換器モデルは、動的な利用可能リソースに合わせて実行を適応させることができる。畳み込みが注意よりも多くのFLOPsを占めており、GPUの最適化により、畳み込みの実行時間がFLOPsの割合よりも小さくなる。これらの洞察を活用して、効率的で動的な視覚変換器推論を実現できる。