강화학습에서의 구조: 조사 및 미해결 문제
강화학습(RL)은 다양한 실세계 시나리오에서 여전히 제한적인 실용성을 가지고 있다. 이는 데이터 효율성 부족, 일반화 능력 제한, 안전 보장 부재, 해석 가능성 부족 등의 문제에서 비롯된다. 이러한 문제를 해결하고 성능을 향상시키기 위한 한 가지 유망한 방법은 학습 과정에 문제에 대한 추가적인 구조 정보를 포함시키는 것이다. 본 논문에서는 이러한 다양한 방법론을 통합적인 틀 아래 정리하고, 구조가 학습 문제에 미치는 역할을 조명하며, 구조를 포함시키는 다양한 패턴을 분류한다. 이를 통해 구조화된 RL의 과제에 대한 통찰을 제공하고, RL 연구에 대한 설계 패턴 관점의 기반을 마련한다.