Concetti Chiave
多様なAIシステムは、人間や動物の空間認知に見られるアナログ表現とは異なる命題的表現に基づいているため、視点取得能力に限界がある。
Sintesi
本研究は、多様なAIシステムの視点取得能力を評価するために、認知心理学の手法を適用しました。具体的には、レベル1とレベル2の視点取得課題を用いて、GPT-4oの性能を検討しました。
レベル1の課題では、GPT-4oは高い正答率を示しましたが、レベル2の課題では、特に大きな角度差がある場合に大きな誤りを犯しました。これは、GPT-4oが視点の変換を伴う空間的推論を苦手としていることを示唆しています。
さらに、言語的な推論を促すチェーン・オブ・シンクプロンプティングを用いても、中間的な角度差の課題では改善が見られませんでした。これは、言語的な情報処理だけでは人間レベルの空間認知を実現できないことを示しています。
本研究の結果は、多様なAIシステムの空間認知能力の限界を明らかにし、人間の発達過程との比較を通じて、今後の研究と開発の方向性を示唆しています。
Statistiche
GPT-4oは、0°と315°の画像で低い正答率を示した。
人間の反応時間は、目標と観察者の角度差が大きくなるにつれて増加する傾向にあった。
Citazioni
「多様なAIモデルは、視覚的情報処理に基づいて課題に取り組んでおり、心的回転などの複雑な統合的プロセスを必要とする人間レベルの空間認知を実現するには、全く新しい計算戦略が必要かもしれない。」