이 연구는 시각-언어 모델에서 소리 상징성이 나타나는지 조사했다. 소리 상징성은 특정 소리와 의미 간의 비임의적 상관관계를 의미하며, 대표적으로 키키-보부바 효과가 있다.
연구진은 인공지능 모델 CLIP과 Stable Diffusion을 활용하여 소리 상징성을 분석했다. 연구 결과, 두 모델 모두 소리와 시각적 의미 간의 연관성을 학습한 것으로 나타났다. 예를 들어, 날카로운 소리를 나타내는 의성어로 생성된 이미지는 날카로운 형태를 보였고, 둥근 소리를 나타내는 의성어로 생성된 이미지는 둥근 형태를 보였다.
이는 시각-언어 모델이 소리와 의미 간의 비임의적 연관성을 학습했음을 보여준다. 이러한 발견은 소리 상징성에 대한 새로운 통찰을 제공하며, 시각-언어 모델의 내부 작동 원리를 이해하는 데 도움이 될 것으로 기대된다.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Morris Alper... о arxiv.org 04-03-2024
https://arxiv.org/pdf/2310.16781.pdfГлибші Запити