本論文では、ビデオゲームプレイにおける人間のような学習方法を模倣するために、直感的な物理学的前提を活用する手法を提案している。
まず、ゲームオブジェクトを「エージェント」「静的オブジェクト」「良い移動オブジェクト」「悪い移動オブジェクト」「エージェントオブジェクト」の5つのカテゴリに分類する。これらのカテゴリは、人間の直感的な物理学的前提に基づいて定義されている。
次に、エージェントの検出には、「一意性」「永続性」「行動-オブジェクト運動の結合」といった人間の直感的な推論を活用する。これにより、ゲームの中でエージェントを特定することができる。
提案手法では、これらのカテゴリ表現とQ学習アルゴリズムを組み合わせることで、ビデオゲームをより人間らしく学習することができる。実験の結果、提案手法は従来のDQNと比べて、ゲームの変形にも強い一般化性能を示すことが分かった。
このように、人間の直感的な物理学的前提を活用することで、ビデオゲームの学習をより人間らしいものにできる可能性が示された。今後は、このアプローチをさらに発展させ、より複雑なゲームや現実世界のタスクにも適用できるようにしていくことが期待される。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문