画像とテキストのペアから密な注釈を必要とせずに、オープンボキャブラリーのセマンティックセグメンテーションを学習する効率的なマルチグレインドクロスモーダルアライメントフレームワークを提案します。
ハードウェア制約下で高解像度の地面実相を活用する新しいアーキテクチャの提案とその効果的な適用方法。
計算画像処理を活用したドメイン適応により、光学収差下でのセマンティックセグメンテーションを実現する。
切り貼り式データ拡張は、衛星画像のセマンティックセグメンテーションモデルの一般化性能を大幅に向上させる。
畳み込み型確率勾配(CPG)損失関数を提案し、物体境界の精度を向上させることで、セマンティックセグメンテーションのパフォーマンスを高める。
Open-RGBTは、RGB-T画像を用いたオープンボキャブラリーセマンティックセグメンテーションを実現する新しいフレームワークであり、視覚的なプロンプトとセマンティックな整合性補正モジュールを統合することで、複雑なシーンでも高精度なゼロショットセグメンテーションを実現します。
AM-SAMは、オブジェクト検出器を用いた自動プロンプト生成と、マスクキャリブレーションによるマスクデコーダの改善により、セマンティックセグメンテーションの精度と効率を向上させる手法である。