本研究は、肺疾患の早期発見と診断支援を目的として、ビジョントランスフォーマーを活用したシステムを提案している。
まず、CT画像やX線画像に対して、コントラスト調整や領域抽出などの前処理を行い、画質を向上させている。次に、データ拡張によって学習データを増強し、モデルの汎化性能を高めている。
その上で、コンパクトな畳み込みトランスフォーマー(CCT)モデルを構築し、肺疾患の分類を行っている。CCTモデルは、畳み込み層とトランスフォーマーエンコーダを組み合わせた構造を持ち、画像の局所的な特徴と全体的な特徴を効果的に捉えることができる。
最後に、Explainable AIの手法であるGrad-CAMを用いて、モデルの判断根拠を可視化している。これにより、医療現場での信頼性向上と、モデルの改善につなげることができる。
実験の結果、CCTモデルは97%の高い訓練精度と94.6%の高い検証精度を達成しており、肺疾患の自動検出に有効であることが示された。本研究は、ビジョントランスフォーマーと Explainable AIの融合により、医療画像診断の高度化に貢献するものと期待される。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Pangoth Sant... kl. arxiv.org 05-07-2024
https://arxiv.org/pdf/2307.16033.pdfDybere Forespørgsler