이 논문은 다중 로봇 작업 할당 문제에서 최대 가중 이분 그래프 매칭 기법을 개선하기 위해 그래프 강화 학습 프레임워크를 제안한다. 이를 통해 전문가가 수동으로 설계한 휴리스틱 대신 학습된 인센티브 함수를 사용하여 로봇-작업 쌍의 가중치를 계산한다.