מושגי ליבה
本研究は、眼底画像の自己教師学習フレームワークを提案し、4つの主要な眼疾患の診断と重症度評価を高精度で実現する。
תקציר
本研究では、自己教師学習ビジョントランスフォーマー(SSVT)を提案し、眼底画像に基づく眼疾患の診断と重症度評価を行った。
まず、88,703枚の無標識眼底画像を用いて自己教師学習を行い、高次元のベクトル表現を生成した。次に、この表現を利用して、4つの主要眼疾患(糖尿病網膜症、加齢黄斑変性、緑内障性視神経症、病的近視)の診断と重症度評価を行った。
実験の結果、SSVTは6つの公開データセットと2つの自社収集データセットにおいて、平均AUCが93.5%、平均精度が97.0%と高い性能を示した。これは、ResNetなどの従来手法と比べて優れた性能である。特に、ViT-b/16ベースのSSVTが最も優れた結果を示した。
本研究の主な貢献は以下の通りである:
自己教師学習フレームワークを構築し、手動アノテーションのコストを削減しつつ、多様な眼疾患への適応性を高めた。
自己注意メカニズムを用いて、眼底画像の大域的な情報を効果的に抽出した。
これらの技術的進歩により、SSVT は自動眼疾患診断の分野において有望な手法であることが示された。特に、医療資源が不足する地域における眼科スクリーニングの改善に貢献できると期待される。
סטטיסטיקה
眼底画像は101,064枚収集された。
自己教師学習には88,702枚の無標識画像を使用した。
眼疾患診断には9,890枚の標識画像を使用した。
外部検証には1,641枚の画像を使用した。