Khái niệm cốt lõi
본 논문에서는 멀티모달 학습에서 단일 모달 의존성 문제를 해결하기 위해 분류기 기반 그래디언트 변조(CGGM) 방법을 제안하며, 이는 그래디언트의 크기와 방향을 모두 고려하여 각 모달의 활용도를 균형 있게 조절하여 멀티모달 정보를 효과적으로 활용합니다.
Tóm tắt
분류기 기반 그래디언트 변조를 통한 향상된 멀티모달 학습
본 연구는 멀티모달 학습에서 모델이 하나의 주요 모달에 지나치게 의존하는 문제를 해결하고자 합니다. 이를 위해 그래디언트 변조 전략을 통해 각 모달의 정보 활용을 균형 있게 조절하여 멀티모달 학습 성능을 향상시키는 것을 목표로 합니다.
본 논문에서는 분류기 기반 그래디언트 변조(CGGM)라는 새로운 방법을 제시합니다. CGGM은 각 모달의 활용도를 평가하기 위해 모달별 분류기를 추가하고 단일 모달 그래디언트를 얻습니다. 이후, 활용도를 기반으로 인코더의 그래디언트 크기를 조절하고 단일 모달 그래디언트를 사용하여 모델이 더 나은 방향으로 최적화되도록 유도합니다.
구체적으로, CGGM은 다음 두 가지 전략을 사용합니다.
그래디언트 크기 변조
각 모달의 상대적 학습 속도를 측정하고, 이를 기반으로 그래디언트 크기를 조절하여 모든 모달이 균형 있게 학습되도록 합니다.
그래디언트 방향 변조
모델이 단일 모달에 의존하여 최적화되는 것을 방지하기 위해, 각 모달의 단일 모달 그래디언트 방향을 고려하여 멀티모달 모델의 그래디언트 방향을 조절합니다.