本研究では、強化学習エージェントが色と形の概念を学習し、それらを組み合わせて未見の組み合わせに対処する能力を調査した。
まず、エージェントを色と形の組み合わせ(C&S)の指示に対して訓練したところ、エージェントは暗黙的に指示を分解し、それらを再構成することで、未見の組み合わせに対処できることが示された。
次に、エージェントに色と形の概念(C|S)を先行して学習させたところ、その後の合成的学習に要する訓練エピソード数が大幅に減少した(100倍と20倍)。さらに、概念学習とその後の合成的学習を経たエージェントのみが、より複雑な未見の環境(C&S&S)で零細的に対処できることが示された。
また、CLIP言語エンコーダを使用したエージェントは、訓練エピソード数が大幅に減少し、さらに5つの未見の色に対しても零細的に対処できることが示された。
これらの結果は、強化学習エージェントが概念と合成性を暗黙的に学習できること、そしてそれらの学習が複雑な課題への一般化に重要であることを示している。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Zijun Lin,Ha... pada arxiv.org 05-06-2024
https://arxiv.org/pdf/2309.04504.pdfPertanyaan yang Lebih Dalam