Core Concepts
제안된 Change-Agent는 다중 수준 변화 해석 모델과 대형 언어 모델을 통해 사용자 요구에 따라 포괄적이고 통찰력 있는 변화 해석 및 분석을 수행할 수 있다.
Abstract
이 논문은 원격 감지 영상의 변화를 포괄적으로 해석하기 위한 Change-Agent를 제안한다. Change-Agent는 다중 수준 변화 해석(MCI) 모델과 대형 언어 모델(LLM)로 구성된다.
MCI 모델은 변화 탐지와 변화 캡셔닝 두 가지 작업을 수행한다. 변화 탐지 분기에서는 다중 스케일 특징을 활용하여 변화 마스크를 생성하고, 변화 캡셔닝 분기에서는 고수준 시각 특징을 활용하여 변화에 대한 설명문을 생성한다. 이를 위해 BI-temporal Iterative Interaction (BI3) 레이어를 제안하여 특징 표현 능력을 향상시켰다.
LLM은 Change-Agent의 뇌 역할을 하며, 사용자 지시에 따라 변화 해석 및 분석을 수행한다. LLM은 변화 탐지 마스크와 변화 설명문 생성 외에도 변화 객체 개수 세기, 변화 원인 분석, 미래 변화 예측 등 다양한 작업을 수행할 수 있다.
실험 결과, 제안된 MCI 모델은 변화 탐지와 변화 캡셔닝 모두에서 우수한 성능을 보였다. 또한 Change-Agent는 사용자 요구에 따라 포괄적이고 통찰력 있는 변화 해석 및 분석을 제공할 수 있음을 확인하였다.
Stats
변화된 도로 객체 수: 5002개
변화된 건물 객체 수: 39378개
변화된 객체의 크기와 변형 정도가 다양함
Quotes
"Change-Agent는 사용자 지시에 따라 포괄적이고 통찰력 있는 변화 해석 및 분석을 수행할 수 있다."
"제안된 MCI 모델은 변화 탐지와 변화 캡셔닝 모두에서 우수한 성능을 보였다."