Core Concepts
脳が未知のオブジェクトを認識する方法を模倣し、予測を通じて3D物体中心表現を学習する新しいネットワークアーキテクチャの開発。
Abstract
人間の知識に基づくオブジェクト表現は、高次概念と象徴的推論をサポートする。本研究では、未知のオブジェクトに対する能力を開発し、脳が直接利用可能な情報だけを使用して、オブジェクトのセグメンテーション、3D位置推定、深度認識を同時に学習する新しいネットワークアーキテクチャが提案された。このアプローチは、未来のシーンを効率的に予測するために脳が使用する視覚入力の潜在原因としてオブジェクト表現が学習されることを示唆している。
Stats
モデルARI-FG: 0.58±0.07(6)
モデルIOU: 0.45±0.02(6)
Quotes
"Objects are treated as latent causes of visual input which the brain uses to make efficient predictions of future scenes."
"The model outperforms all compared models on both metrics."
"Our result also provides insights for brain research."