이 연구는 3D 비전-언어 모델의 언어 강건성을 체계적으로 평가하기 위해 3D 언어 강건성 벤치마크를 제안한다. 이 벤치마크는 언어학 이론에 기반하여 다양한 언어 스타일 변화를 모델링한 3D 언어 강건성 데이터셋을 활용한다.
실험 결과, 기존 3D 비전-언어 모델들은 언어 스타일 변화에 매우 취약한 것으로 나타났다. 이는 모델의 융합 모듈이 훈련 데이터의 언어 패턴에 편향되어 있기 때문인 것으로 분석되었다.
이를 해결하기 위해 저자들은 추가 훈련 없이 적용 가능한 LLM 기반의 사전 정렬 모듈을 제안했다. 이 모듈은 기존 모델의 성능을 크게 향상시킬 수 있었다. 또한 데이터 증강에 대한 분석을 통해, 제안 방법의 효과성과 실용성을 입증하였다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Weipeng Deng... alle arxiv.org 03-25-2024
https://arxiv.org/pdf/2403.14760.pdfDomande più approfondite