核心概念
SAM 2は、画像と動画の両方において、プロンプトを用いたインタラクティブなセグメンテーションを可能にする、より高速で正確な基礎モデルであり、ビデオセグメンテーションにおける大きな進歩を示している。
要約
SAM 2: 画像と動画におけるセグメント・アニシング
Ravi, N., Gabeur, V., Hu, Y.-T., Hu, R., Ryali, C., Ma, T., ... & Feichtenhofer, C. (2024). SAM 2: Segment Anything in Images and Videos. arXiv preprint arXiv:2408.00714v2.
本研究は、画像内の任意のオブジェクトをセグメント化する能力を持つ基礎モデルであるSegment Anything Model (SAM) を動画に拡張し、画像と動画の両方でインタラクティブなセグメンテーションを可能にすることを目的とする。