AT-MoE는 복잡한 작업을 효율적으로 처리하기 위해 작업별 전문가를 훈련하고, 작업 지침에 따라 전문가 가중치를 동적으로 할당하는 적응형 그룹 라우팅 모듈을 사용하는 새로운 신경망 아키텍처입니다.