핵심 개념
본 논문에서는 에이전트가 다양한 작업에 적용 가능한 스킬들을 자율적으로 습득하여 새로운 작업에 대한 제로샷 일반화 성능을 향상시키는 SaMI(Skill-aware Mutual Information)라는 새로운 메타 강화 학습 프레임워크를 제안합니다.
초록
스킬 인지 상호 정보 최적화를 통한 강화 학습 일반화: 연구 논문 요약
Yu, X., Dunion, M., Li, X., & Albrecht, S. V. (2024). Skill-aware Mutual Information Optimisation for Generalisation in Reinforcement Learning. Advances in Neural Information Processing Systems, 38.
본 연구는 메타 강화 학습 (Meta-RL) 에이전트가 다양한 환경 특징과 최적 스킬이 요구되는 작업 전반에서 일반화하는 데 어려움을 겪는 문제를 해결하고자 합니다. 저자들은 에이전트가 작업 전반에서 서로 다른 스킬을 식별하고 실행할 수 있도록 스킬 인지 방식으로 컨텍스트 임베딩을 구분하고, 제한된 샘플 크기에서 발생하는 로그-K 문제를 완화하는 것을 목표로 합니다.