Core Concepts
新しい2Dトランスフォーマーエンコーダーブロックを使用したADAPTモデルは、3D MRI画像の診断に優れた性能を発揮します。
Abstract
ADAPTは、共有セルフアテンションエンコーダー、次元固有のセルフアテンションエンコーダー、内部次元クロスアテンションエンコーダー、および間次元クロスアテンションエンコーダーを使用して高次元の3D MRI画像から情報を抽出し結合します。新しい融合アテンションメカニズムと形態学的拡張などの革新的な手法を採用しています。ADAPTは、医師がMRI画像の異なる寸法により多くの注意を払うことを可能にする適応型トレーニング戦略も提供します。実験では、ADAPTはさまざまな3D画像分類ネットワークと比較して最も優れたパフォーマンスを達成しました。視覚化結果は、ADAPTが3D MRI画像のAD関連領域に焦点を当てることができることを示しています。
Stats
ADAPTモデルは最小限のメモリ使用量でさまざまな3D画像分類ネットワークよりも優れたパフォーマンスを発揮します。
ADAPTは4つの特殊エンコーダー後に注目マップが成功裏にAD関連領域に焦点を当てることができます。
ADAPTは10枚のサギタルビューから16枚のスライスと19枚の冠状および軸状ビューから選択することで最高性能を発揮します。
Quotes
"An image is worth 16x16 words: Transformers for image recognition at scale." - Dosovitskiy et al., 2020
"Understanding the effective receptive field in deep convolutional neural networks." - Luo et al., 2016
"The clinical use of structural MRI in Alzheimer disease." - Frisoni et al., 2010