다중 에이전트 경로 탐색 문제를 해결하기 위해 선택적 통신 기반의 Q-learning 모델을 제안하고, 우선순위 기반 충돌 해결, 고급 탈출 정책, 하이브리드 전문가 지도 등의 고급 추론 전략을 도입하여 성능을 향상시킨다.