Core Concepts
상태 공간 모델(SSM)인 Mamba를 활용하여 도메인 일반화 성능을 향상시키는 새로운 프레임워크 DGMamba를 제안한다. DGMamba는 은닉 상태 억제(HSS)와 의미 인식 패치 정제(SPR)라는 두 가지 핵심 모듈을 포함하여 도메인 특정 정보를 효과적으로 제거하고 일반화 성능을 높인다.
Abstract
이 논문은 도메인 일반화(DG) 문제를 해결하기 위해 상태 공간 모델(SSM) 기반 접근법을 제안한다. 기존 CNN 및 ViT 기반 DG 방법들은 제한적인 수용 영역 또는 복잡한 계산 복잡도 문제를 겪는다. 반면 Mamba와 같은 SSM은 선형 복잡도와 전역 수용 영역을 가지지만, 도메인 이동 문제에 적용하기 어려운 한계가 있다.
이에 저자들은 DGMamba라는 새로운 DG 프레임워크를 제안한다. DGMamba는 두 가지 핵심 모듈로 구성된다:
- 은닉 상태 억제(HSS): 은닉 상태에 포함된 도메인 특정 정보를 억제하여 일반화 성능을 높인다.
- 의미 인식 패치 정제(SPR):
- 사전 없는 스캐닝(PFS): 이미지 패치를 무작위로 섞어 문맥 정보의 편향을 줄인다.
- 도메인 문맥 교환(DCI): 문맥 패치를 다른 도메인의 패치로 대체하여 도메인 간 문맥 정보와 질감 노이즈를 도입한다.
이를 통해 DGMamba는 도메인 일반화 성능을 크게 향상시키며, 동시에 선형 복잡도와 전역 수용 영역의 장점을 유지한다. 실험 결과 DGMamba는 다양한 벤치마크에서 최신 기술 대비 우수한 성능을 보인다.
Stats
도메인 일반화 문제에서 기존 CNN 및 ViT 기반 모델들은 제한적인 수용 영역 또는 복잡한 계산 복잡도 문제를 겪는다.
상태 공간 모델(SSM)인 Mamba는 선형 복잡도와 전역 수용 영역을 가지지만, 도메인 이동 문제에 적용하기 어려운 한계가 있다.
Quotes
"Mamba, as an emerging state space model (SSM), possesses superior linear complexity and global receptive fields. Despite this, it can hardly be applied to DG to address distribution shifts, due to the hidden state issues and inappropriate scan mechanisms."
"Motivated by the above facts, we propose DGMamba, a novel State Space Model-based framework for domain generalization that excels in strong generalizability toward unseen domains and meanwhile has the advantages of global receptive fields, and efficient linear complexity."