그래프는 연결된 개체 간의 관계를 나타내는 자연스러운 표현 방식이며, 이산 구조에 대한 목적 함수와 관련된 조합 최적화 문제는 해결 공간의 급격한 증가로 인해 어려운 경우가 많다. 최근 강화 학습은 기존의 정확 알고리즘 및 (메타)启발式 방법에 비해 더 나은 의사 결정 전략을 발견하는 데 유망한 대안으로 부상했다.