Core Concepts
深層学習を用いることで、胎児炎症反応(FIR)のステージを臍帯の病理画像から高精度に診断できる可能性が示された。
Abstract
論文情報
Ayada, M. A., Nateghib, R., Sharma, A., Chillrud, L., Seesillapachaia, T., Cooper, L. A. D., & Goldstein, J. A. (2023). Deep Learning for Fetal Inflammatory Response Diagnosis in the Umbilical Cord. Preprint.
研究目的
本研究は、胎児炎症反応 (FIR) の診断における深層学習モデルの有効性と、その解釈可能性について検証することを目的とする。
方法
- 2011年から2023年までに採取された4100枚の臍帯組織学的スライドをデジタル化し、胎児炎症反応 (FIR) のステージ (FIR 0, FIR 1, FIR 2,3) に基づいて分類した。
- ImageNetで事前学習したConvNeXtXLargeモデルと、病理画像で事前学習したfoundation modelであるUNIを用いて、それぞれ特徴量を抽出した。
- Attention-based multiple instance learning (MIL)を用いて、WSIレベルでのFIRステージ分類モデルを構築した。
- モデルの解釈可能性を評価するために、attention mapを作成し、モデルがどの領域に着目して診断を行っているかを可視化した。
結果
- UNIを用いたモデルは、ConvNeXtXLargeを用いたモデルよりも高い精度でFIRステージを分類できた。
- 特に、UNIを用いたモデルは、FIR 2,3において高い精度を示し、attention mapから動脈炎の領域を正確に捉えていることが確認された。
- FIR 1の診断においては、モデルはWharton膠質や臍帯血管全体にattentionを示しており、動脈と静脈の区別が課題として残った。
結論
本研究の結果、深層学習を用いることで、胎児炎症反応のステージを臍帯の病理画像から高精度に診断できる可能性が示された。
特に、病理画像で事前学習したfoundation modelを用いることで、より高い精度が得られることが示唆された。
ただし、FIR 1の診断における動脈と静脈の識別など、さらなる改善が必要な点も明らかになった。
意義
本研究は、胎児炎症反応の診断における深層学習の有用性を示しただけでなく、モデルの解釈可能性についても重要な知見を提供している。
これは、深層学習モデルの臨床応用を進める上で重要なステップとなる。
限界と今後の研究
- 本研究では、単一施設のデータを用いており、多施設での検証が必要である。
- 今後は、より多くの症例データを用いてモデルの精度を向上させる必要がある。
- また、FIR 1の診断における動脈と静脈の識別など、モデルの解釈可能性を向上させるための研究も必要である。
Stats
データセットは4100枚のスライドから構成され、FIR 0が3337枚、FIR 1が480枚、FIR 2が252枚、FIR 3が31枚であった。
FIR3の症例数が少なかったため、FIR2とFIR3を合わせて3つのクラスに分類した。
データセットは、トレーニングセット(80%)、バリデーションセット(10%)、テストセット(10%)に分割された。
UNIを用いたモデルのアンサンブルは、バランス精度0.836を達成した。
ConvNeXtXLargeを用いたモデルのアンサンブルは、バランス精度0.721を達成した。