포인터 네트워크와 Q-Learning을 결합한 PQN(Pointer Q-Network) 모델은 OP 문제에서 우수한 성능을 보인다. PQN은 포인터 네트워크의 순열 생성 능력과 Q-Learning의 장기 보상 평가 능력을 효과적으로 활용하여 OP 문제의 복잡성을 해결한다.