Core Concepts
비전 모델의 예측을 설명할 때는 반드시 공간적 맥락 정보를 고려해야 한다. 현재 널리 사용되는 설명 방법들은 이러한 맥락 정보를 간과하고 있어, 실제 상황에서 정확한 설명을 제공하지 못한다.
Abstract
이 논문은 비전 모델의 예측을 설명할 때 공간적 맥락 정보의 중요성을 강조한다.
먼저 저자들은 이미지 내 맥락 정보의 유형을 세 가지로 구분한다: 의미론적 맥락, 공간적 맥락, 크기 맥락. 특히 공간적 맥락은 거리, 포함/배제, 순서, 방향 등의 요소로 구성된다.
이러한 공간적 맥락 정보는 자율주행차, 감시 시스템, 의료 진단, 농업 등 다양한 분야에서 중요한 역할을 한다. 그러나 현재 널리 사용되는 시각적 설명 방법들은 이러한 맥락 정보를 고려하지 않아, 실제 상황에서 정확한 설명을 제공하지 못한다.
저자들은 이 문제를 해결하기 위해 새로운 연구 방향을 제안한다. 첫째, 공간적 맥락 이해를 평가할 수 있는 벤치마크 데이터셋이 필요하다. 둘째, 공간적 맥락을 정량적으로 측정할 수 있는 새로운 지표가 필요하다. 셋째, 기존 시각적 설명 방법 외에 다양한 설명 기법이 필요하다.
이를 통해 비전 모델의 예측을 보다 정확하고 포괄적으로 설명할 수 있을 것으로 기대된다.
Stats
자율주행차 시스템에서 보행자와 차량 간 거리 정보가 중요하다.
의료 영상에서 병변의 공간적 분포 정보(군집 vs. 퍼짐)가 질병 단계 진단에 중요하다.
위성 영상에서 주변 환경 정보가 토지 분석에 중요하다.
Quotes
"공간적 관계는 인간이 이미지를 분석할 때 중요한 정보이지만, 현재 DL 모델의 예측을 설명하는 방법에는 반영되지 않고 있다."
"기존 시각적 설명 방법으로는 공간적 맥락이 중요한 경우 모델의 예측을 정확히 설명할 수 없다."