다중 모달 대형 언어 모델은 단일 모달 편향(언어 편향, 시각 편향)에 과도하게 의존하여 복잡한 다중 모달 과제에서 잘못된 답변을 생성한다. 이를 해결하기 위해 인과 관계 분석 프레임워크를 제안하고, 편향을 극복하기 위한 새로운 데이터셋과 완화 전략을 소개한다.