Core Concepts
提案されたアプローチは、インタラクティブ画像セグメンテーションにおいて、革新的な方法を導入し、最先端のパフォーマンスを達成することができる。
Abstract
この研究では、深層ニューラルネットワーク(DNN)に基づくインタラクティブ画像セグメンテーションフレームワークが提案されています。提案されたフレームワークは、3つの革新的なコンポーネントから構成されており、それぞれ以下のようになっています。
イテレーション・クリック損失(ICL)に基づくトレーニング:ICLは、クリック数を最小限に抑える革新的なアプローチを導入しています。
カスケード・フォワード・リファインメント(CFR)に基づく推論:CFRは、2つのループを使用してセグメンテーション結果を反復的に洗練する統一フレームワークを採用しています。
SUEM Copy-Paste画像拡張:SUEM C&Pは、より多様なトレーニングセットを生成する包括的な画像拡張手法です。
これらのコンポーネントの効果を検証するために包括的な実験が行われており、提案されたアプローチが最先端のパフォーマンスを達成していることが示されています。
Stats
33.2% and 15.5% the number of clicks required to surpass an IoU of 0.95 in the previous state-of-the-art approach on the Berkeley and DAVIS sets, respectively.