本研究では、視覚系の側膝状体(LGN)と一次視覚野(V1)の相互作用をモデル化するための新しい深層学習アプローチを提案している。
まず、LGNからV1への順方向経路では、畳み込み自己符号化器(pAE)モデルを使用して入力画像のエッジ検出を行う。次に、V1からLGNへの逆方向経路では、pAEデコーダを使用して元の画像を再構築する。この双方向の情報流を統合することで、LGNの機能をより正確にモデル化できる。
さらに、LGN出力を使用して動物と非動物の2クラス分類を行うために、AlexNetおよびHMAXモデルを活用する。実験の結果、提案手法は人間の分類精度を大幅に上回ることが示された。特に、時間的情報を考慮した場合の分類精度が高く、LGNモデリングの重要性が確認された。
一方、古典的なGabor Filter Bank(GFB)やDiscrete Wavelet Transform(DWT)などの手法と比較しても、提案手法の優位性が確認された。これは、深層学習モデルであるpAEが複雑な特徴を自動的に学習できるためと考えられる。
全体として、本研究は視覚系の生物学的なメカニズムを効果的にモデル化し、優れた分類性能を実現した点で意義深い。今後は、より複雑な視覚課題への適用や、他の脳領域との統合などが期待される。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Moslem Gorji... om arxiv.org 09-23-2024
https://arxiv.org/pdf/2409.13622.pdfDiepere vragen