マスクオートエンコーダを活用することで、異なるセンサーで取得された画像間の意味的類似性を効果的にモデル化できる。これにより、センサー非依存型の画像検索が可能となる。
本論文では、リモートセンシング画像のパンシャープニングタスクに特化した新しい手法であるContent-Adaptive Non-Local Convolution (CANConv)を提案する。CANConvは空間的な適応性と非局所的な自己類似性を同時に活用することで、優れたパンシャープニング性能を実現する。
提案するBFSeg フレームワークは、効率的で効果的な建物フットプリント抽出を実現する。密に接続されたコース-ファインフィーチャー融合デコーダーネットワークと、不純な領域を無視する寛容な深層監視および自己蒸留戦略により、高度な特徴抽出ネットワークを建物抽出タスクに効果的に適用できる。
本研究は、リモートセンシング画像からの高精度な湖沼抽出を実現するために、プロンプトを活用した二段階の強化フレームワークを提案する。
本研究では、パンシャープニングの性能を大幅に向上させるため、交差変調トランスフォーマー(CMT)と複合損失関数を提案した。CMTは、空間的特徴と分光的特徴の融合を効果的に行うことができ、複合損失関数は広域の特徴と局所的な質感を同時に捉えることができる。これにより、空間解像度の向上と分光情報の保持を両立した高品質なマルチスペクトル画像の生成が可能となった。
同質的な視覚トークナイザーを設計することで、画像の基本要素を意味的に独立した領域とし、効率的かつ高精度な画像理解を実現できる。
本研究は、変化プライオリティを活用して参照ベースの超解像を行うことで、リモートセンシング画像の時空間解像度の橋渡しを実現する。具体的には、変化プライオリティを条件付き拡散モデルに注入し、変化領域の意味的な再構築と変化のない領域のテクスチャ転移を効果的に行う。
リモートセンシング画像における半教師付き物体検出の品質向上と量の増加を目指す新しいアクティブ学習手法が提案された。