Core Concepts
딥 강화 학습 기반의 최적 물체 포장 순서 생성과 높이 맵 기반 배치 전략을 통해 박스 사용 수 최소화 및 공간 활용도 극대화
Abstract
본 연구는 정규 형상의 2D 및 3D 빈 포장 문제를 해결하기 위한 새로운 최적화 방법론을 제안한다.
먼저, 수정된 포인터 네트워크 기반의 딥 강화 학습 모델을 통해 최적의 물체 포장 순서를 생성한다.
다음으로, 높이 맵 기반의 배치 전략을 활용하여 순서대로 물체를 박스에 배치한다. 이때 물체가 박스 내부 또는 다른 물체와 충돌하지 않도록 한다.
보상 및 손실 함수는 박스의 압축도, 피라미드 형태, 사용 개수 등을 고려하여 정의되며, 온-정책 액터-비평가 프레임워크에 기반하여 딥 강화 학습 모델을 학습시킨다.
실험 결과, 제안 방법이 기존 포장 방법들에 비해 포장 정확도와 효율성 면에서 우수한 성능을 보였다.
Stats
박스 당 평균 압축도: 0.929
박스 당 평균 피라미드: 0.985
박스 사용 개수: 4.203개
인스턴스 당 처리 시간: 0.764ms
Quotes
"딥 강화 학습 기반의 최적 물체 포장 순서 생성과 높이 맵 기반 배치 전략을 통해 박스 사용 수 최소화 및 공간 활용도 극대화"
"제안 방법이 기존 포장 방법들에 비해 포장 정확도와 효율성 면에서 우수한 성능을 보였다"