Konsep Inti
Open-RGBTは、RGB-T画像を用いたオープンボキャブラリーセマンティックセグメンテーションを実現する新しいフレームワークであり、視覚的なプロンプトとセマンティックな整合性補正モジュールを統合することで、複雑なシーンでも高精度なゼロショットセグメンテーションを実現します。
Abstrak
Open-RGBT: オープンワールド環境におけるオープンボキャブラリーRGB-Tゼロショットセマンティックセグメンテーション
Meng Yu, Luojie Yang, Xunjie He, Yi Yang, Yufeng Yue. (2024). Open-RGBT: Open-vocabulary RGB-T Zero-shot Semantic Segmentation in Open-world Environments. arXiv preprint arXiv:2410.06626v1.
本研究は、従来のRGB-Tセマンティックセグメンテーションモデルの限界を克服するために、オープンボキャブラリー学習を用いた新しいマルチモーダルセマンティックセグメンテーションモデルであるOpen-RGBTを提案することを目的としています。