本論文は、参照画像セグメンテーションの課題に取り組んでいる。参照画像セグメンテーションとは、自然言語表現によって指定された物体をイメージから抽出するタスクである。主な課題は、言語特徴から視覚特徴への効果的な意味情報の伝播である。
提案手法CRFormerは以下の特徴を持つ:
実験の結果、提案手法CRFormerは、RefCOCO、RefCOCO+、G-Refの3つのベンチマークデータセットにおいて、最先端手法を上回る性能を示した。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Yichen Yan,X... a las arxiv.org 04-15-2024
https://arxiv.org/pdf/2404.08281.pdfConsultas más profundas