이 논문은 시각적 지식의 기원과 정의를 소개하고, 대규모 모델 이전 시대의 시각적 지식 연구 동향을 검토한다.
시각적 지식의 핵심 구성요소는 다음과 같다:
이러한 시각적 지식 구성요소는 인간의 시각 정보 처리 및 인지 과정을 모방하여 기계 지능을 향상시키는 데 핵심적이다.
대규모 모델 시대에는 시각적 지식이 대규모 모델의 한계를 극복하고 신뢰성, 해석 가능성, 일반화 능력을 높이는 데 기여할 것으로 기대된다. 반대로 대규모 모델은 시각적 지식 개발에 새로운 기회를 제공할 것이다.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Wenguan Wang... às arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04308.pdfPerguntas Mais Profundas