"Continuous policies fail to achieve optimality and feasibility in scenarios with complex constraints."
"Bifurcated policies exhibit distinct behavioral modes in response to continuous changes in state."
このアプローチへの反論として考えられる点はいくつかあります。まず第一に、Gaussian mixture distribution を使用したポリシー構築方法は計算コストが高くなりやすい可能性があります。また、特定の状況やタスクにおいて他の手法やアルゴリズムよりも優れているかどうかは明確ではありません。さらに、連続的なポリシーよりも不連続性を持つポリシーが現実世界で十分に機能するかどうかも議論される余地があります。