Core Concepts
手術シーンにおけるリアルタイム手術器具セグメンテーションのための新しいフレームワークが提案されています。
Abstract
SAM(Segment Anything Model)とTAP(Tracking Any Point)の組み合わせにより、高速かつ精度の高い手術器具セグメンテーションが可能となる。
軽量なSAM変種を使用して推論効率を向上させ、外科シーンでの汎用性を高める。
CoTrackerなどのオンラインポイントトラッカーを組み合わせて、映像内で一貫性を持たせたセグメンテーションが行われる。
EndoVis 2015データセットで25 FPS以上の推論速度を達成し、最先端の半教師付きビデオオブジェクトセグメンテーション方法を凌駕する結果が得られている。
Stats
エンドビス2015データセットにおいて、25 FPSで動作するGeForce RTX 4060 GPU上で25以上FPSの推論速度を達成しています。
Quotes
"Our proposed method outperforms the state-of-the-art semi-supervised VOS model, XMem, on the EndoVis 2015 dataset."
"Extensive experiments validate the advancement of our proposed pipeline."