核心概念
SpineFMは、脊椎X線画像における椎骨のセグメンテーションと識別において最先端の性能を実現する、新規のパイプラインである。
書誌情報
Simons, S. J., & Papież, B. W. (2024). SpineFM: Leveraging Foundation Models for Automatic Spine X-ray Segmentation. arXiv preprint arXiv:2411.00326.
研究目的
本研究は、頸椎および腰椎のX線画像における椎骨の自動セグメンテーションと識別の精度向上を目的とする。従来の手法では、データアノテーションの負担が大きく、新規データセットへの転移性に課題があった。そこで本研究では、大規模データセットで学習した基礎モデルを用いることで、これらの課題を克服することを目指す。
方法
本研究では、医用画像セグメンテーションのための基礎モデルであるMedical-SAM-Adaptor (Med-SA) を活用した新規パイプラインSpineFMを提案する。SpineFMは、まずMask R-CNNを用いて椎骨の位置を大まかに推定し、Med-SAを用いて椎骨のセグメンテーションを行う。次に、脊椎の解剖学的構造を利用して、隣接する椎骨の位置を帰納的に推定する。この帰納的なプロセスは、脊椎の末端椎骨が検出されるか、新たな椎骨のマスクが前の椎骨のマスクと重複した場合に終了する。
主な結果
提案手法であるSpineFMを、公開されている2つの脊椎X線画像データセット(NHANES II、CSXA)を用いて評価した。その結果、SpineFMは、NHANES IIデータセットにおいて、頸椎と腰椎のセクションでそれぞれ0.925と0.916の全体的なDSCを達成し、従来の最先端手法であるVertXNetのDSC(それぞれ0.880と0.863)を上回った。また、CSXAデータセットにおいても、SpineFMは、ラベル付けされたすべての椎骨の99.5%を正しく識別し、高いセグメンテーション精度を達成した。
結論
本研究で提案したSpineFMは、脊椎X線画像における椎骨のセグメンテーションにおいて、従来手法を上回る性能を達成することを示した。SpineFMは、Med-SAを用いることで、高精度なセグメンテーションを実現するとともに、帰納的なアプローチを用いることで、データアノテーションの負担を軽減している。
意義
SpineFMは、脊椎X線画像の自動分析のための重要な基盤技術となる可能性がある。SpineFMを用いることで、臨床医の負担を軽減し、診断の精度向上に貢献することが期待される。
限界と今後の研究
本研究では、NHANES IIデータセットにおいて、一部の椎骨の識別が不完全であるという課題が残った。これは、X線画像の飽和レベルのばらつきにより、コントラストが低下することが原因であると考えられる。今後の研究では、コントラストのばらつきに頑健な手法を開発する必要がある。また、CSXAデータセットでは、椎骨の形状を正確に評価するために、より詳細なアノテーションを用いることが望ましい。
統計
NHANES IIデータセットで頸椎セクションにおいて全体的なDSCが0.925を達成。
NHANES IIデータセットで腰椎セクションにおいて全体的なDSCが0.916を達成。
VertXNetのNHANES IIデータセットでのDSCは、頸椎で0.880、腰椎で0.863。
CSXAデータセットでラベル付けされたすべての椎骨の99.5%を正しく識別。