이 논문은 조합 최적화 문제(COPs)를 해결하기 위한 새로운 기법인 게이지 변환(GT)을 제안한다. COPs는 실세계에서 많이 발생하는 문제이지만 NP-hard 특성으로 인해 해결이 어렵다. 최근 강화 학습(RL) 기반 모델이 COPs 해결을 위한 유망한 접근법으로 부각되고 있지만, 기존 RL 모델은 탐색 범위가 제한적이라는 한계가 있다.
논문에서 제안하는 GT 기법은 다음과 같은 장점을 가진다:
실험 결과, GT를 적용한 S2V-DQN-GT 모델이 기존 RL 모델 대비 최대 컷 문제에서 월등한 성능을 보였다. 또한 GT의 효과는 학습 그래프 특성, 초기 상태 설정, GT 반복 횟수 등 다양한 요인에 따라 달라짐을 확인하였다.
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Tianle Pu,Ch... ที่ arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04661.pdfสอบถามเพิ่มเติม