Conceitos essenciais
強化学習エージェントが、隣接関係の制約を考慮しながら、オブジェクトを可能な限り密接に配置することを学習する。
Resumo
本研究では、強化学習を用いて、ロボットマニピュレータが不規則な形状のオブジェクトを、事前に定義された隣接関係の制約に従って、可能な限り密接に配置することを学習する。
まず、レイアウトに定義された隣接関係を表す概念を導入する。次に、報酬関数の設計により、エージェントが隣接オブジェクトとの距離を最小化しつつ、衝突を回避するように学習する。
実験の結果、提案手法は、2つのベースラインと比較して、アセンブリの密度を平均60%以上向上させ、同程度の密度で衝突も少なくなることを示した。これは、隣接関係の制約を考慮しつつ、オブジェクト形状に応じて最適な配置を学習できることを意味している。
Estatísticas
オブジェクトアセンブリの境界ボックスの増加率は、提案手法が34.78%±6.88であるのに対し、ベースライン1が67.68%±14.33、ベースライン2が330.46%±37.86と大きかった。
オブジェクトの角度差は、提案手法が3.32°±1.17、ベースラインが0.14°±0.11と0.15°±0.13と小さかった。
オブジェクト間の平均距離は、提案手法が10.73mm±1.64、ベースラインが26.22mm±2.36と25.28mm±2.04と大きかった。
衝突率は、提案手法が8.92%±7.44、ベースラインが0%と0%であった。