그래프는 연결된 개체 간의 관계를 나타내는 자연스러운 표현 방식이며, 이산 구조에 대한 목적 함수와 관련된 조합 최적화 문제는 해결 공간의 급격한 증가로 인해 어려운 경우가 많다. 최근 강화 학습은 기존의 정확 알고리즘 및 (메타)启발式 방법에 비해 더 나은 의사 결정 전략을 발견하는 데 유망한 대안으로 부상했다.
제한된 정보, 소스 간 상호작용, 확산 모델 의존성과 같은 문제를 해결하기 위해 베이지안 최적화 기반의 시뮬레이션 방법을 제안합니다.