核心概念
従来のシーングラフ生成 (SGG) 手法は、定義済みのオブジェクトや関係カテゴリの認識に限定されていましたが、本稿では、視覚概念のアラインメントと保持を通じて、未知のカテゴリを認識できる、完全オープンボキャブラリーSGGのための新しいフレームワーク、OvSGTRを提案します。
要約
シーングラフ生成におけるオープンボキャブラリー問題への包括的なアプローチ
Chen, Z., Wu, J., Lei, Z., Zhang, Z., & Chen, C. W. (2024). Expanding Scene Graph Boundaries: Fully Open-vocabulary Scene Graph Generation via Visual-Concept Alignment and Retention. arXiv preprint arXiv:2311.10988v2.
本研究は、従来のシーングラフ生成 (SGG) 手法における、定義済みのオブジェクトや関係カテゴリの認識に限定されるという制限を克服し、未知のカテゴリを認識できる完全オープンボキャブラリーSGGを実現することを目的とする。