본 논문에서는 방대한 수의 중복 전문가를 활용하여 모듈식 희소 아키텍처를 구현하는 딥러닝 방법인 COMET(Conditionally Overlapping Mixture of ExperTs)을 제안하며, 이는 기존 MoE 아키텍처의 문제점을 해결하고 입력 유사성에 기반한 전문가 중복을 통해 더 빠른 학습과 향상된 일반화를 가능하게 합니다.
COMET, a novel sparse neural network architecture, enhances performance and knowledge transfer in deep learning models by employing a fixed, biologically inspired routing function to create conditionally overlapping experts.