핵심 개념
본 논문에서는 분산형 제조 시스템의 자율 최적화를 향상시키기 위해 상태 기반 잠재 게임(SbPG)에 전이 학습을 적용하는 새로운 접근 방식을 제시합니다.
초록
분산형 제조 시스템의 공정 최적화를 위한 상태 기반 잠재 게임의 전이 학습
본 연구는 대규모 제조 시스템에서 유사한 동작을 하는 플레이어 간의 지식 공유 및 전이를 통해 자가 학습 메커니즘을 개선하는 것을 목표로 합니다. 특히, 상태 기반 잠재 게임(SbPG)에 전이 학습을 적용하여 플레이어의 학습 결과를 개선하고 학습 프로세스를 가속화하는 새로운 접근 방식을 제시합니다.
본 논문에서는 두 가지 전이 학습 설정을 제안합니다.
1. 사전 정의된 유사성 기반 전이 학습
플레이어 간의 유사성이 사전에 정의된 경우, 학습 프로세스 시작 시 유사성을 기반으로 지식 전이를 미리 결정할 수 있습니다.
이를 위해 두 가지 접근 방식을 제시합니다.
슬라이딩 윈도우(SW) 접근 방식: 특정 시간 범위 내에서 플레이어 간의 행동 유사성을 측정하여 지식 전이를 수행합니다.
모멘텀 기반(MOM) 접근 방식: 이전 손실과 현재 손실을 모두 고려하여 지식 전이를 수행합니다.
2. 동적 유사성 추론 기반 전이 학습
플레이어 간의 유사성 정보가 없는 경우, 학습 중에 동적으로 유사성을 추론하여 지식 전이를 수행합니다.
이를 위해 방사 기저 함수 네트워크를 사용하여 플레이어 간의 유사성을 측정합니다.