本論文は、専門家の意図駆動行動を模倣学習するための新しいアルゴリズムIDILを提案している。従来の模倣学習アプローチは、専門家の行動が観測可能な状況のみに依存すると仮定していた。しかし実際には、専門家の内在的な意図が行動に大きな影響を及ぼすことが知られている。
IDILは、専門家の意図を潜在変数としてモデル化し、意図駆動の専門家行動を学習する。具体的には以下の2つのステップを繰り返し行う:
この反復的なアプローチにより、IDILは大規模な状態空間を持つ課題でも安定して学習を行うことができる。また、生成モデルを学習するため、専門家の多様な行動を捉えることができる。
実験の結果、IDILは従来手法と比べて、課題遂行能力、意図推定精度、行動の多様性の面で優れた性能を示した。特に、専門家の意図が重要な役割を果たす課題において、IDILの優位性が確認された。
To Another Language
from source content
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Sangwon Seo,... ที่ arxiv.org 04-29-2024
https://arxiv.org/pdf/2404.16989.pdfสอบถามเพิ่มเติม