핵심 개념
시각적 지식은 시각적 개념, 관계, 연산, 추론을 통해 시각 정보를 포괄적이고 해석 가능한 방식으로 표현할 수 있는 새로운 지식 표현 형식이다. 대규모 모델의 등장은 시각적 지식 개발에 새로운 기회와 역할을 제시한다.
초록
이 논문은 시각적 지식의 기원과 정의를 소개하고, 대규모 모델 이전 시대의 시각적 지식 연구 동향을 검토한다.
시각적 지식의 핵심 구성요소는 다음과 같다:
시각적 개념: 시각 개체의 전형적인 속성(모양, 크기, 색상, 질감 등)을 포착하는 프로토타입 및 범위 기반 표현
시각적 관계: 시각 개체 간의 기하학적, 시간적, 의미론적, 기능적, 인과적 관계
시각적 연산: 시각 개체에 대한 구성, 분해, 대체, 결합, 변형, 운동, 비교, 파괴, 복원, 예측 등의 변환
시각적 추론: 시각 개념, 관계, 연산을 활용하여 시각 정보로부터 타당한 결론을 도출하는 과정
이러한 시각적 지식 구성요소는 인간의 시각 정보 처리 및 인지 과정을 모방하여 기계 지능을 향상시키는 데 핵심적이다.
대규모 모델 시대에는 시각적 지식이 대규모 모델의 한계를 극복하고 신뢰성, 해석 가능성, 일반화 능력을 높이는 데 기여할 것으로 기대된다. 반대로 대규모 모델은 시각적 지식 개발에 새로운 기회를 제공할 것이다.
통계
인간 뇌의 약 절반이 시각 정보 처리에 사용된다.
인간은 텍스트보다 이미지를 60,000배 빨리 처리할 수 있다.
인간의 90%의 정보 전달은 시각을 통해 이루어진다.
인용구
"시각적 지식은 시각적 개념과 그 관계를 간결하고 포괄적이며 해석 가능한 방식으로 포착할 수 있는 새로운 지식 표현 형식이다."
"시각적 지식은 단순한 시각 개체의 추상적 표현이 아니라 시각 개체를 조작하는 능동적이고 생성적인 과정을 포함한다."