ClickVOSは、ビデオ内の対象物をセグメント化する新しいタスクであり、初めてのフレームでの単一クリックによる点注釈をサポートする拡張データセットも提供しています。提案されたABSアプローチは、人間の注意プロセスを模倣し、ClickVOSにおいて優れたパフォーマンスを達成しています。さらに、関連分野からの既存アルゴリズムを利用したベースライン探索が行われ、ABSアプローチの優越性が実証されました。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Pinxue Guo,L... kl. arxiv.org 03-12-2024
https://arxiv.org/pdf/2403.06130.pdfDybere Forespørgsler