이 연구는 시각적 정박이 단어 학습에 미치는 영향을 조사했다. 다양한 신경망 언어 모델 아키텍처를 사용하여 시각적 정보와 텍스트 정보를 결합하는 방식을 탐구했다. 단어 유사성, 어휘 관계, 의미 특징, 단어 유사도, 인간 신경 표현과의 정렬 등 단어 지식의 다양한 측면을 평가했다.
연구 결과, 시각적 정박은 저데이터 환경에서 단어 유사성과 의미 특징 학습의 효율성을 높일 수 있다. 그러나 이 효과는 텍스트 내 단어 공동 출현 정보가 제한적일 때만 관찰되었다. 오히려 풍부한 텍스트 정보가 있을 때는 시각적 정보가 오히려 단어 학습을 방해할 수 있다. 이는 텍스트와 이미지가 전달하는 정보가 중복되지 않고 보완적이라는 것을 보여준다. 하지만 현재의 다중 모달 모델링 접근법은 인간과 유사한 단어 표현을 구축하는 데 효과적으로 시각 정보를 활용하지 못하고 있다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Chengxu Zhua... في arxiv.org 03-27-2024
https://arxiv.org/pdf/2310.13257.pdfاستفسارات أعمق