이 논문은 전문가의 의도 주도 행동을 모방하는 IDIL이라는 새로운 모방 학습 알고리즘을 소개합니다. 전문가의 행동은 관찰 가능한 상황 정보뿐만 아니라 그들의 내재적 의도에 의해 영향을 받습니다. 기존 모방 학습 기법은 이러한 의도 요인을 고려하지 않아 전문가 행동의 다양성을 모델링하는 데 한계가 있었습니다.
IDIL은 전문가 시연에서 의도 정보를 추론하고, 이를 활용하여 전문가의 의도 주도 행동 모델을 학습합니다. 이를 위해 IDIL은 전문가 정책과 의도 동역학을 각각 학습하는 두 단계로 구성됩니다. 실험 결과, IDIL은 기존 모방 학습 기법에 비해 우수한 과제 수행 능력과 전문가 의도 추론 성능을 보였으며, 다양한 해석 가능한 전문가 행동을 생성할 수 있음을 확인했습니다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Sangwon Seo,... kl. arxiv.org 04-29-2024
https://arxiv.org/pdf/2404.16989.pdfDybere Forespørgsler