本研究では、自然画像における物体の実世界サイズ、網膜サイズ、実世界深度の表現を、人間の脳波信号と人工ニューラルネットワークを用いて明らかにした。
主な結果は以下の通り:
人間の脳波信号では、実世界深度の表現が最も早く現れ、次に網膜サイズ、最後に実世界サイズの表現が現れた。これらの表現は互いに独立していた。
人工ニューラルネットワークの解析でも、同様の結果が得られた。早期層では網膜サイズと実世界深度の表現が見られ、後期層では実世界サイズの表現が見られた。
背景情報を取り除いた物体のみの画像を入力しても、実世界サイズの表現は人工ニューラルネットワークの後期層で保たれていた。一方、実世界深度の表現は背景情報に依存していた。
物体の単語情報のみを入力したWord2Vecモデルでも、実世界サイズの表現が見られた。
以上の結果から、実世界サイズは視覚情報と意味情報を統合した高次元の物体表現であり、人間の脳と人工システムの両方で安定して表現されることが明らかになった。
To Another Language
from source content
biorxiv.org
Key Insights Distilled From
by Lu,Z., Golom... at www.biorxiv.org 08-21-2023
https://www.biorxiv.org/content/10.1101/2023.08.19.553999v5Deeper Inquiries