本論文は、行動モデル学習の理論的な枠組みを提案している。主な内容は以下の通りである:
行動モデル学習問題をバージョンスペースの学習問題として定式化する。具体的には、各行動の前提条件と効果に対応するバージョンスペースを維持する。
バージョンスペースの更新ルールを定義し、オンラインアルゴリズムVSLAMを提案する。VSLAMは、すべての一貫性のある行動モデルを表現する境界を出力する。
VSLAMの出力を操作することで、安全性と完全性を保証する行動モデルを抽出する方法を示す。安全モデルは確実に正しい遷移のみを許容し、完全モデルは可能な遷移をすべて含む。
実験評価により、提案手法の有用性を示す。安全モデルと完全モデルは学習初期の段階で相補的な性質を持つことが分かった。
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Diego Aineto... às arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09631.pdfPerguntas Mais Profundas