核心概念
最新のトランスフォーマーモデルをオンラインおよびリアルタイム基準に適応し、品質の低下を抑えながら高速化する方法を提案します。
統計資料
これらの最新の手法は20フレーム/秒以上の一貫したスループットを実現しています。
引述
"Video inpainting tasks have seen significant improvements in recent years with the rise of deep neural networks and, in particular, vision transformers."
"Models leveraging a deep learning approach have made significant progress recently, especially on the temporal consistency that was lacking from more traditional methods."